Python 파충류 홈 페이지 사진 캡 처 방법

3419 단어 python파충붙잡다
도입
그동안 파 이 썬 의 것 을 배 워 왔 는데 예전 부터 파 이 썬 파충류 가 얼마나 대단한 지 들 었 는데 마침 여기까지 배 웠 다.자라 의 파 이 썬 동 영상 을 따라 파충류 프로그램 을 써 서 간단 한 홈 페이지 사진 다운 로드 를 할 수 있다.
코드

__author__ = "JentZhang"
import urllib.request
import os
import random
import re
def url_open(url):
  '''
      
  :param url:
  :return:
  '''
  req = urllib.request.Request(url)
  req.add_header('User-Agent',
          'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/49.0.2623.75 Safari/537.36')
  #     
  '''
  proxyies = ["111.155.116.237:8123","101.236.23.202:8866","122.114.31.177:808"]
  proxy = random.choice(proxyies)
  proxy_support = urllib.request.ProxyHandler({"http": proxy})
  opener = urllib.request.build_opener(proxy_support)
  urllib.request.install_opener(opener)
  '''
  response = urllib.request.urlopen(url)
  html = response.read()
  return html
def save_img(folder, img_addrs):
  '''
      
  :param folder:        
  :param img_addrs:     (  )
  :return:
  '''
  #            
  if not os.path.exists(folder):
    os.mkdir(folder)
  os.chdir(folder)
  for each in img_addrs:
    filename = each.split('/')[-1]
    try:
      with open(filename, 'wb') as f:
        img = url_open("http:" + each)
        f.write(img)
    except urllib.error.HTTPError as e:
      # print(e.reason)
      pass
  print('  !')
def find_imgs(url):
  '''
           
  :param url:     
  :return:        
  '''
  html = url_open(url).decode("utf-8")
  img_addrs = re.findall(r'src="(.+?\.gif)', html)
  return img_addrs
def get_page(url):
  '''
               
  :param url:     
  :return:
  '''
  html = url_open(url).decode('utf-8')
  a = html.find("current-comment-page") + 23
  b = html.find("]</span>", a)
  return html[a:b]
def download_mm(url="http://jandan.net/ooxx/", folder="OOXX", pages=1):
  '''
     (    )
  :param folder:        
  :param pages:      
  :return:
  '''
  page_num = int(get_page(url))
  for i in range(pages):
    page_num -= i
    page_url = url + "page-" + str(page_num) + "#comments"
    img_addrs = find_imgs(page_url)
    save_img(folder, img_addrs)
if __name__ == "__main__":
  download_mm()
3.총화
코드 에 접근 한 사이트 주 소 는 이미 반 파충류 알고리즘 을 사 용 했 기 때문이다.그래서 원 하 는 그림 을 못 올 라 가 겠 어 요.so,파충류 의 노트 를 적 었 다 고 생각 하 세 요.학습 참고 로[얼굴 가리기]...
마지막:jpg 형식 을 gif 로 바 꾸 고 불쌍 한 gif 그림 까지 올 라 갈 수 있 습 니 다.
 
첫 번 째 장 은 바로 반 파충류 체제 의 그림 자리 표시 자 로 전혀 내용 이 없다.
총결산
위 에서 말 한 것 은 소 편 이 여러분 에 게 소개 한 Python 파충류 의 홈 페이지 사진 을 캡 처 하 는 방법 입 니 다.여러분 에 게 도움 이 되 기 를 바 랍 니 다.궁금 한 점 이 있 으 면 메 시 지 를 남 겨 주세요.소 편 은 제때에 답 해 드 리 겠 습 니 다.여기 서도 저희 사이트 에 대한 여러분 의 지지 에 감 사 드 립 니 다!

좋은 웹페이지 즐겨찾기