초 간결 mzitu 사이트 제목 분류 액세스 세트
import requests
from pyquery import PyQuery as pq
import os
Picreferer = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) '
'Chrome/73.0.3683.103 Safari/537.36',
'Referer': 'http://i.meizitu.net'
}
Hostreferer = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) '
'Chrome/73.0.3683.103 Safari/537.36',
'Referer': 'http://www.mzitu.com'
}
url_one = 'https://www.mzitu.com'
html_one = requests.get(url_one, headers=Hostreferer).text
doc = pq(html_one)
items = doc('.page-numbers')
page_numbers = items.text()[10:13]
page_number = input(" ?")
print("#" + page_number + "#")
y = 0
if int(page_number) <= int(page_numbers):
for i in range(1, int(page_number) + 1):
url_list = 'https://www.mzitu.com/page/' + str(i)
html_list = requests.get(url_list, headers=Hostreferer).text
doc = pq(html_list)
items = doc(' li span a').items()
for item in items:
y += 1
taotu = item.attr('href')
title = item.text()
print(" :" + title)
try:
os.chdir('./data./meizitu')
except:
os.mkdir('./data./meizitu')
os.chdir('./data./meizitu')
os.mkdir('./' + title)
os.chdir('./' + title)
url = taotu
html = requests.get(url, headers=Hostreferer).text
doc = pq(html)
items = doc('.pagenavi span')
max_pic = items.text()[15:17]
for m in range(1, int(max_pic) + 1):
href = url + '/' + str(m)
html_new = requests.get(href, headers=Hostreferer).text
doc = pq(html_new)
item = doc('.main-image img')
photo_url = item.attr('src')
response = requests.get(photo_url, headers=Hostreferer)
with open(str(y) + "." + str(m) + ".jpg", "ab") as ft:
ft.write(response.content)
os.chdir("../../../")
print(" ", i, " ")
이 내용에 흥미가 있습니까?
현재 기사가 여러분의 문제를 해결하지 못하는 경우 AI 엔진은 머신러닝 분석(스마트 모델이 방금 만들어져 부정확한 경우가 있을 수 있음)을 통해 가장 유사한 기사를 추천합니다:
다양한 언어의 JSONJSON은 Javascript 표기법을 사용하여 데이터 구조를 레이아웃하는 데이터 형식입니다. 그러나 Javascript가 코드에서 이러한 구조를 나타낼 수 있는 유일한 언어는 아닙니다. 저는 일반적으로 '객체'{}...
텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
CC BY-SA 2.5, CC BY-SA 3.0 및 CC BY-SA 4.0에 따라 라이센스가 부여됩니다.