콩잎을 파헤치는 최신 추천 도서
from requests.exceptions import RequestException from bs4 import BeautifulSoup import requests import re,time,json
def getPage(url):'''지정된 url 페이지 정보를 기어오르기''try: #요청 헤더 정보 headers 정의 = {'User-Agent':'User-Agent: Mozilla/5.0(Windows NT6.1;rv:2.0.1) Gecko/2010 10Firefox/4.0.1'
}
#
res = requests.get(url,headers=headers)
# ,
if res.status_code == 200:
return res.text
else:
return None
except RequestException:
return None
def parsePage (content): '' 웹 페이지의 내용을 분석하고 필드 결과를 되돌려줍니다 '# HTML 문서 doc = pq (content) # 웹 페이지의 모든 탭을 가져와 출력 탭 이름 items = doc ("div.detail-frame") # 봉인된 데이터를 옮겨다니며 for item in items로 되돌려줍니다.items(): yield {'책이름:'item.find('a').text(),'그림 출처:'item.find('a').attr('href'),'평점:'item.find('p.rating').text(),'저자:'item.find('colp.or-gray').text('),'소개':item.find('p.detail.text)(')
# ' :' :item.find("p").text(),
}
def writeFile (content): '파일 쓰기 실행' print (content)
def main(): url = “https://book.douban.com/latest#print(url) html = getPage(url) # 데이터를 추출했는지 판단하고 해석 함수인 if html: for item in parsePage(html): writeFile(item)
if name == ‘main’: main() time.sleep(2)
이 내용에 흥미가 있습니까?
현재 기사가 여러분의 문제를 해결하지 못하는 경우 AI 엔진은 머신러닝 분석(스마트 모델이 방금 만들어져 부정확한 경우가 있을 수 있음)을 통해 가장 유사한 기사를 추천합니다:
다양한 언어의 JSONJSON은 Javascript 표기법을 사용하여 데이터 구조를 레이아웃하는 데이터 형식입니다. 그러나 Javascript가 코드에서 이러한 구조를 나타낼 수 있는 유일한 언어는 아닙니다. 저는 일반적으로 '객체'{}...
텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
CC BY-SA 2.5, CC BY-SA 3.0 및 CC BY-SA 4.0에 따라 라이센스가 부여됩니다.