python 파충류--약망을 기어오르는 약품 정보-excel표에 쓰기
10983 단어 파충류
import requests
from lxml import etree
import xlwt
def write_to_excel(infos):
# workbook
workbook = xlwt.Workbook(encoding='utf-8')
# sheet
sheet = workbook.add_sheet('word_list')
#
head =[]
keys = infos[0].keys()
#
for key in keys:
head.append(key)
#
for i in range(len(head)):
sheet.write(0,i,head[i])
i = 1# ,
for item in infos:
for j in range(len(head)):
sheet.write(i,j,item[head[j]])
i+=1
#
workbook.save('word.xls')
print(' !')
def get_text(text):
if text:
return text[0]
return ''
def parse_page(html_str):
tree = etree.HTML(html_str)
li_list = tree.xpath('//ul[@id="itemSearchList"]/li')
## , , ,
for li in li_list:
# print(li)
price = get_text(li.xpath('.//div[@isrecom="0"]/p[1]/textarea/span/text()|.//div[@isrecom="0"]/p[1]/span/text()|.//div[@isrecom="0"]/p[1]/span/u/text()')).strip()
name = li.xpath('.//div[@isrecom="0"]/p[2]/a/text()')[1].strip()
comment = get_text(li.xpath('.//div[@class="sell_type_div"]/span/a/em/text()')).strip()
url = get_text(li.xpath('.//div[@class="itemSearchResultCon"]/a[1]/@href')).strip()
item = {}
item['price'] = price
item['name'] = name
item['comment'] = comment
item['url'] = 'https:' + url
print(item)
infos.append(item)
def main():
base_url = 'https://www.111.com.cn/categories/953710-a0-b0-c31-d0-e0-f0-g0-h0-i0-j%s.html'
headers = {
'user-agent': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.86 Safari/537.36',
}
for i in range(1,10):
response = requests.get(base_url %i,headers=headers)
parse_page(response.text)
if __name__ == '__main__':
infos = []
main()
write_to_excel(infos)
이 내용에 흥미가 있습니까?
현재 기사가 여러분의 문제를 해결하지 못하는 경우 AI 엔진은 머신러닝 분석(스마트 모델이 방금 만들어져 부정확한 경우가 있을 수 있음)을 통해 가장 유사한 기사를 추천합니다:
python은 어떻게 파충류의 효율을 향상시킬 것인가단일 스레드 + 멀티태스킹 비동기 협동 협정 함수(특수 함수)를 정의할 때 async 수식을 사용합니다. 함수 호출 후 내부 문장은 즉시 실행되지 않고 협동 대상으로 되돌아옵니다. 퀘스트 대상 작업 대상 = 고급 협...
텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
CC BY-SA 2.5, CC BY-SA 3.0 및 CC BY-SA 4.0에 따라 라이센스가 부여됩니다.