python 은 ZOL 벽 지 를 기어 올 라 가 로 컬 에 대량으로 다운로드 합 니 다.
2604 단어 [데이터 파충류]
주소 찾기:http://desk.zol.com.cn/dongwu/1920x1080/ 페이지 오 르 기: 1 - 2 페이지 저장 위치: D 디스크 루트 디 렉 터 리
실행 조건: 컴퓨터 설치 python 3.0 +
코드:
from urllib import request,error
import re
url = "http://desk.zol.com.cn/dongwu/1920x1200/"
urls = []
urls.append(url)
for i in range(2,2):
urls.append(url + "%r.html" % i)
########################### ########################
for url in urls:
try:
response = request.urlopen(url) #
byte_html = response.read() # html 'byte'
html =str(byte_html) #
pattern = re.compile(r'.*?')
imglist = re.findall(pattern,html) # 태그 의 href 주소
truelist= []
for item in imglist:
if re.match(r'^\/bizhi\/',item):
truelist.append(item)
except error.HTTPError as e:
print(e.reason)
except error.URLError as e:
print(e.reason)
except:
pass
\ # \ # \ # \ # \ # \ # \ # \ # \ # \ # \ # \ # \ # \ # \ # \ # \ # \ # \ # \ # \ # \ # \ # \ # \ # \ # \ # 모든 벽지 에 대한 주 소 를 가 져 와 로 컬 로 다운로드 합 니 다 \ # \ # \ # \ # \ # \ # \ # \ # \ # # \ # \ # \ # \ # \ # \ # \ # \ # \ # \ # # \ # \ # \ # \ # \ # # \ # \ # \ # # \ # \ # \ # # \ # \ # \ # # \ # \ # \ #
x = 0
for wall_pager_page in truelist :
print('-' * 40)
print(wall_pager_page)
url1 = "http://desk.zol.com.cn" + wall_pager_page
response1 = request.urlopen(url1)
byte_html1 = response1.read()
html1 = str(byte_html1)
pattern1 = re.compile(r'.*?')
urllist = re.findall(pattern1,html1)
print('url1:'+urllist[0])
html2 = str(request.urlopen("http://desk.zol.com.cn"+urllist[0]).read())
pattern2 = re.compile(r'
실행 결과:
저 장 된 그림: