Python 3.x 파충류 가 웹 페이지 그림 을 다운로드 하 는 실례 설명

1.인터넷 주 소 를 선택 하여 파충 류 를 한다.
이번 에는 pixabay 사진 사 이 트 를 선택 하 겠 습 니 다.

url=https://pixabay.com/


2.그림 오른쪽 단 추 를 선택 하여 보기 요 소 를 선택 하여 그림 링크 를 찾 는 규칙


여러 개의 그림 경 로 를 보면 src 경로 가 모두 포함 되 어 있 음 을 알 수 있 습 니 다.https://cdn.pixabay.com/photo/ 공공 부분 및 그림 형식 은.jpg 이 므 로 정규 표현 식 은?

re.compile(r'^https://cdn.pixabay.com/photo/.*?jpg$') 
이상 의 분석 을 통 해 우 리 는 프로그램 을 쓰기 시작 할 수 있다.

#-*- coding:utf-8 -*-
import re
import requests
import os
from bs4 import BeautifulSoup

url = 'https://pixabay.com/'
html = requests.get(url).text #      
print(html)
#                     ,  5     。
#data-objurl="http://pic38.nipic.com/20140218/17995031_091821599000_2.jpg"        
soup = BeautifulSoup(html,'html.parser',from_encoding='utf-8')
#^abc.*?qwe$
pic_url = soup.find_all('img',src=re.compile(r'^https://cdn.pixabay.com/photo/.*?jpg$'))
#pic_url = pic_node.get_text()
#pic_url = re.findall('"https://cdn.pixabay.com/photo/""(.*?)",',html,re.S)
print(pic_url)
i = 0
#  image       ,      
if not os.path.exists('image'):
 os.makedirs('image')
for url in pic_url:
 img = url['src']
 try:
 pic = requests.get(img,timeout=5) #       5   
 except requests.exceptions.ConnectionError:
 print('        ')
 continue
 file_name = "image/"+str(i)+".jpg" #     
 print(file_name)
 #       
 fp = open(file_name,'wb')
 fp.write(pic.content) #    
 fp.close()
 i+=1
코드 가 간단 하지 않 습 니까?주 소 를 수정 하고 다른 사 이 트 를 오 르 려 면 다운로드 이미지 경로 의 공통점 을 분석 하고 합 리 적 인 정규 표현 식 을 디자인 하 십시오.그렇지 않 으 면 그림 경 로 를 얻 을 수 없습니다.
실행 프로 세 스 캡 처:

이 파 이 썬 3.x 파충류 가 웹 페이지 사진 을 다운로드 한 사례 설명 은 바로 편집장 이 여러분 에 게 공유 한 모든 내용 입 니 다.참고 하 시 기 를 바 랍 니 다.여러분 들 도 많이 응원 해 주 셨 으 면 좋 겠 습 니 다.

좋은 웹페이지 즐겨찾기