Python 학습 노트(5):상품 데이터 한 페이지 오 르 기
from bs4 import BeautifulSoup
import requests
import time
#
def get_links_from(who_sells):
links = []
urls = ['http://bj.58.com/pbdn/{}/pn{}/'.format(who_sells,i) for i in range(1,10)]
for signal_url in urls:
wb_data = requests.get(signal_url)
time.sleep(5) # ,
if wb_data.status_code == 200:
soup = BeautifulSoup(wb_data.text, 'lxml')
for link in soup.select('td.t a.t'):
links.append(link.get('href'))
return links
def get_detail(who_sells=0):
urls = get_links_from(who_sells)
for url in urls:
wd_data = requests.get(url)
soup = BeautifulSoup(wd_data.text, 'lxml')
# ,
catalogs = soup.select('div > span > a')
titles = soup.select('.info_titile')
prices = soup.select('.price_now i')
tags = soup.select('.biaoqian_li')
ranges = soup.select('.palce_li span i')
views = soup.select('.look_time')
# select , , price[0]
for catalog, title, price, tag, range,view in zip(catalogs, titles, prices, tags, ranges,views):
data = {
'catalog': catalog.get_text(),
'title': title.get_text(),
'price': price.get_text(),
'tag': tag.get_text(),
'range': range.get_text(),
'view': view.get_text(),
}
print(data)
# ,0 ( ),1
get_detail()
총결산
이 내용에 흥미가 있습니까?
현재 기사가 여러분의 문제를 해결하지 못하는 경우 AI 엔진은 머신러닝 분석(스마트 모델이 방금 만들어져 부정확한 경우가 있을 수 있음)을 통해 가장 유사한 기사를 추천합니다:
다양한 언어의 JSONJSON은 Javascript 표기법을 사용하여 데이터 구조를 레이아웃하는 데이터 형식입니다. 그러나 Javascript가 코드에서 이러한 구조를 나타낼 수 있는 유일한 언어는 아닙니다. 저는 일반적으로 '객체'{}...
텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
CC BY-SA 2.5, CC BY-SA 3.0 및 CC BY-SA 4.0에 따라 라이센스가 부여됩니다.