python 파충류 간단하게 페이지 그림 잡고 로컬에 저장

1、      ，   utf-8

   #coding=utf-8

   #-*-conding:UTF-8 -*-

#coding=utf-8

import urllib import re #py             def getHtml(url): page = urllib.urlopen(url) html = page.read() return html print html

html = getHtml("http://tieba.baidu.com/p/2460150866")

       html   CSS   JS  。

，

#coding=utf-8 import urllib import re #py              #       def getHtml(url): page = urllib.urlopen(url) html = page.read() return html

#        
def getImg(html):
    reg = r'src="(.+?\.jpg)" pic_ext'
    imgre = re.compile(reg)
    imglist = re.findall(imgre,html)
    return imglist

html = getHtml("http://tieba.baidu.com/p/2460150866")

print getImg(html)

，

#coding=utf-8 import urllib import re #py              #       def getHtml(url): page = urllib.urlopen(url) html = page.read() return html #         def getImg(html): reg = r'src="(.+?\.jpg)" pic_ext'  imgre = re.compile(reg) imglist = re.findall(imgre,html) return imglist #           x = 0  for imgurl in imglist: #       urllib.urlretrieve(imgurl,'/Applications/MAMP/image/%s.jpg' % x) x+=1  html = getHtml("http://tieba.baidu.com/p/2460150866") print getImg(html)

      ，    ，

   ，     python     。

     ：http://www.wang-chao.cn/

이 내용에 흥미가 있습니까?

현재 기사가 여러분의 문제를 해결하지 못하는 경우 AI 엔진은 머신러닝 분석(스마트 모델이 방금 만들어져 부정확한 경우가 있을 수 있음)을 통해 가장 유사한 기사를 추천합니다:

Python 파충류: 웹 요청 헤더에 User-Agent 추가

텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.

CC BY-SA 2.5, CC BY-SA 3.0 및 CC BY-SA 4.0에 따라 라이센스가 부여됩니다.

python 파충류 간단하게 페이지 그림 잡고 로컬에 저장

좋은 웹페이지 즐겨찾기