Python 파충류 지 련 채용 정보
15408 단어 개발 하 다.
#coding:utf-8
import urllib2
import re
import xlwt
class ZLZP(object):
def __init__(self,workname,citys):
#
self.workname = workname
# URL
self.url = 'http://sou.zhaopin.com/jobs/searchresult.ashx?'
#
args = 'kw=%s&jl='%workname
#
for city in citys:
#
if city == citys[-1]:
args += city
else:
args += city
args += '%2B'
# kw=python&jl= %2B %2B %2B %2B
# url
self.url += args
self.headers = {
'User-Agent':'Mozilla/5.0 (Windows NT 6.1; WOW64; rv:54.0) Gecko/20100101 Firefox/54.0'
}
# HTML
def get_page(self,pageNum):
# 1. url
getUrl = self.url + '&p=%s'%pageNum
# 2. request
request = urllib2.Request(getUrl,headers=self.headers)
try:
response = urllib2.urlopen(request)
except Exception ,e:
print ' %s , %s'%(pageNum,e)
return None
else:
return response.read()
# html
def get_total(self,html):
# 1.
pattern = re.compile(r'# 2.
rs = re.search(pattern,html)
# 3. ,
total = int(rs.group(1))
print ' %s ...'%total
# 60 , +1
if total%60 == 0:
self.totalPage = total/60
else:
self.totalPage = total/60+1
#
def get_data(self,html):
# 1.
# print html
pattern = re.compile(r'(.*?).*?(.*?)(.*?)' ,re.S)
# 2. html
results = re.findall(pattern,html)
# 3.
rs_data = []
for rs in results:
remove_b = re.compile(r'<.>',re.S)
name = re.sub(remove_b,'',rs[0])
rs_tp = (name,rs[1],rs[2],rs[3])
rs_data.append(rs_tp)
return rs_data
#
def start(self):
# 1. HTML
html = self.get_page(1)
if html == None:
return
# 2. html
self.get_total(html)
# 3.for ( 10 )
# workbook
workbook = xlwt.Workbook(encoding='utf-8')
print type(self.workname)
# unicode str unicode
# GBK,
print type(unicode(self.workname,encoding='utf-8'))
name = u' '+unicode(self.workname,encoding='utf-8')
print type(name)
sheet = workbook.add_sheet(name)
sheet.write(0,0,' ')
sheet.write(0,1,' ')
sheet.write(0,2,' ')
sheet.write(0,3,' ')
# count
count = 1
for x in range(1,11):
# 1. HTML
print ' %s ....'%x
html = self.get_page(x)
if html == None:
continue
# 2. html
rs_data = self.get_data(html)
# 3.
for rs in rs_data:
sheet.write(count,0,rs[0])
sheet.write(count,1,rs[1])
sheet.write(count,2,rs[2])
sheet.write(count,3,rs[3])
count+=1
#
print type(self.workname)
filename = u' %s .xls'%unicode(self.workname,encoding='utf-8')
workbook.save(filename)
'''
Python3 :
, UTF-8
Python , Unicode
unicode(self.workname,encoding='utf-8')
str 、'' ""
'''
if __name__ == '__main__':
workname = raw_input(' :')
#
citys = []
# 5 ,
while len(citys) < 5:
city = raw_input(' , 5 , 0 :')
if city == '0':
break
citys.append(city)
zlzp = ZLZP(workname,citys)
zlzp.start()
이 내용에 흥미가 있습니까?
현재 기사가 여러분의 문제를 해결하지 못하는 경우 AI 엔진은 머신러닝 분석(스마트 모델이 방금 만들어져 부정확한 경우가 있을 수 있음)을 통해 가장 유사한 기사를 추천합니다:
셸 스 크 립 트 작성 조수 -- by lustslost기능: 1. 같은 이름 의 파일 이 존재 하 는 지 자동 으로 감지 하고, 존재 하 는 경우 사용자 의 존 재 를 알 리 며, 편집, 삭제 후 생 성, 종료 3 가지 옵션 을 제공 합 니 다. 2. 스 크 립 트 저...
텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
CC BY-SA 2.5, CC BY-SA 3.0 및 CC BY-SA 4.0에 따라 라이센스가 부여됩니다.