Python 학습 노트 의 간단 한 파충류
2230 단어 파 이 썬 언어
현 단계 에 우 리 는 urllib 모듈 을 이용 하여 가장 간단 한 파충 류 를 만 들 었 습 니 다. 비교적 간단 하기 때문에 코드 를 직접 보면 됩 니 다.주요 지식 은 urllib 모듈 의 각 함수 에 정규 표현 식 을 더 해 완성 하 는 것 이다.
#encoding:utf-8
import re
import urllib
# urllib urlopen() url
# html ,
def gethtml(url):
content=urllib.urlopen(url)
html=content.read()
return html
#
def geturls(html):
r=r'data-src="(http://.*?)"'
alllist=re.findall(r,html)
return alllist
# urlretrieve()
def download(list):
x=0
for li in list:
x=x+1
urllib.urlretrieve(li,"%s.jpg"%x)
if __name__ == '__main__':
#
url = "http://neihanshequ.com/pic/"
#
html = gethtml(url)
#
list = geturls(html)
#
download(list)
print list
이 내용에 흥미가 있습니까?
현재 기사가 여러분의 문제를 해결하지 못하는 경우 AI 엔진은 머신러닝 분석(스마트 모델이 방금 만들어져 부정확한 경우가 있을 수 있음)을 통해 가장 유사한 기사를 추천합니다:
베 일 스 알고리즘 및 그 응용 사례베 이 루스 분류 알고리즘: 베 이 루스 분 류 는 통계학 의 분류 알고리즘 으로 확률 통계 지식 을 이용 하여 분류 하 는 알고리즘 이다.많은 장소 에서 소박 한 베 이 루스 (Na ï ve Bayes, NB) 분...
텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
CC BY-SA 2.5, CC BY-SA 3.0 및 CC BY-SA 4.0에 따라 라이센스가 부여됩니다.