python 은 ZOL 벽 지 를 기어 올 라 가 로 컬 에 대량으로 다운로드 합 니 다.

2604 단어 [데이터 파충류]
성명: 참고, 학습 만 제공 합 니 다.
주소 찾기:http://desk.zol.com.cn/dongwu/1920x1080/ 페이지 오 르 기: 1 - 2 페이지 저장 위치: D 디스크 루트 디 렉 터 리
실행 조건: 컴퓨터 설치 python 3.0 +
코드:
from urllib import request,error
import re
url = "http://desk.zol.com.cn/dongwu/1920x1200/"
urls = []

urls.append(url)
for i in range(2,2):
    urls.append(url + "%r.html" % i)
###########################         ########################
for url in urls:
    try:
        response = request.urlopen(url)         #    
        byte_html = response.read()             #   html 'byte'  
        html =str(byte_html)                    #      
        pattern = re.compile(r'.*?')
        imglist = re.findall(pattern,html)      #  태그 의 href 주소
truelist= []
for item in imglist:
if re.match(r'^\/bizhi\/',item):
truelist.append(item)
except error.HTTPError as e:
print(e.reason)
except error.URLError as e:
print(e.reason)
except:
pass
\ # \ # \ # \ # \ # \ # \ # \ # \ # \ # \ # \ # \ # \ # \ # \ # \ # \ # \ # \ # \ # \ # \ # \ # \ # \ # \ # 모든 벽지 에 대한 주 소 를 가 져 와 로 컬 로 다운로드 합 니 다 \ # \ # \ # \ # \ # \ # \ # \ # \ # # \ # \ # \ # \ # \ # \ # \ # \ # \ # \ # # \ # \ # \ # \ # \ # # \ # \ # \ # # \ # \ # \ # # \ # \ # \ # # \ # \ # \ #
x = 0
for wall_pager_page in truelist :
print('-' * 40)
print(wall_pager_page)
url1 = "http://desk.zol.com.cn" + wall_pager_page
response1 = request.urlopen(url1)
byte_html1 = response1.read()
html1 = str(byte_html1)
pattern1 = re.compile(r'.*?')
        urllist = re.findall(pattern1,html1)
        print('url1:'+urllist[0])
        html2 = str(request.urlopen("http://desk.zol.com.cn"+urllist[0]).read())

        pattern2 = re.compile(r'

실행 결과: python爬取ZOL壁纸,并批量下载到本地_第1张图片
저 장 된 그림: python爬取ZOL壁纸,并批量下载到本地_第2张图片

좋은 웹페이지 즐겨찾기