python 파충류 간단하게 페이지 그림 잡고 로컬에 저장
2279 단어 python 파충류
1、 , utf-8
#coding=utf-8
#-*-conding:UTF-8 -*-
#coding=utf-8
import urllib import re #py def getHtml(url): page = urllib.urlopen(url) html = page.read() return html print html
#
html = getHtml("http://tieba.baidu.com/p/2460150866")
html CSS JS 。
,
#coding=utf-8 import urllib import re #py # def getHtml(url): page = urllib.urlopen(url) html = page.read() return html
#
def getImg(html):
reg = r'src="(.+?\.jpg)" pic_ext'
imgre = re.compile(reg)
imglist = re.findall(imgre,html)
return imglist
html = getHtml("http://tieba.baidu.com/p/2460150866")
print getImg(html)
,
#coding=utf-8 import urllib import re #py # def getHtml(url): page = urllib.urlopen(url) html = page.read() return html # def getImg(html): reg = r'src="(.+?\.jpg)" pic_ext' imgre = re.compile(reg) imglist = re.findall(imgre,html) return imglist # x = 0 for imgurl in imglist: # urllib.urlretrieve(imgurl,'/Applications/MAMP/image/%s.jpg' % x) x+=1 html = getHtml("http://tieba.baidu.com/p/2460150866") print getImg(html)
, ,
, python 。
:http://www.wang-chao.cn/
이 내용에 흥미가 있습니까?
현재 기사가 여러분의 문제를 해결하지 못하는 경우 AI 엔진은 머신러닝 분석(스마트 모델이 방금 만들어져 부정확한 경우가 있을 수 있음)을 통해 가장 유사한 기사를 추천합니다:
Python 파충류: 웹 요청 헤더에 User-Agent 추가텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
CC BY-SA 2.5, CC BY-SA 3.0 및 CC BY-SA 4.0에 따라 라이센스가 부여됩니다.