Python 학습 노트 의 간단 한 파충류

2230 단어 파 이 썬 언어
파충 류 는 코드 를 통 해 사이트 에 있 는 당신 이 원 하 는 모든 정 보 를 캡 처 하 는 것 입 니 다. 예 를 들 어 인터넷 에서 재 미 있 는 사진 을 많이 보 았 습 니 다. 파충 류 를 할 줄 모 르 면 제 가 다른 한 장 을 저장 하 는 것 이 아 닙 니까? 파충 류 를 할 줄 알 면 소리 없 이 그림 을 다운로드 해서 천천히 감상 할 수 있 습 니 다.
현 단계 에 우 리 는 urllib 모듈 을 이용 하여 가장 간단 한 파충 류 를 만 들 었 습 니 다. 비교적 간단 하기 때문에 코드 를 직접 보면 됩 니 다.주요 지식 은 urllib 모듈 의 각 함수 에 정규 표현 식 을 더 해 완성 하 는 것 이다.
#encoding:utf-8

import re
import urllib

#  urllib urlopen()      url  
#      html  ,
def gethtml(url):
    content=urllib.urlopen(url)
    html=content.read()
    return html


#                 
def geturls(html):
    r=r'data-src="(http://.*?)"'
    alllist=re.findall(r,html)
    return alllist

#  urlretrieve()    
def download(list):
    x=0
    for li in list:
        x=x+1
        urllib.urlretrieve(li,"%s.jpg"%x)

if  __name__ == '__main__':
    #    
    url = "http://neihanshequ.com/pic/"
    #      
    html = gethtml(url)
    #              
    list = geturls(html)
    #    
    download(list)

    print list

좋은 웹페이지 즐겨찾기