Python 파충류 파일 다운로드

오늘 우리 가 말 하고 자 하 는 내용 은 만약 웹 페이지 에 파일 자원 이 존재 한다 면,예 를 들 어 그림,영화,문서 등 이다.어떻게 파 이 썬 파충 류 를 통 해 이 자원 들 을 다운로드 합 니까?
1.어떻게 인터넷 에서 자원 을 찾 습 니까?
바로 바 이 두 그림 의 예 를 들 어 다음 그림 에서 바 이 두 그림 에서 주 제 를 검색 하면 관련 된 그림 을 많이 꺼 낼 수 있 습 니 다.
그리고 만약 에 영 어 를 배우 고 싶다 면 한 사 이 트 를 찾 으 면 mp3 의 듣 기 자원 이 많 습 니 다.이런 것들 은 모두 당신 이 얻 고 싶 은 내용 일 수 있 습 니 다.
지금 은 인터넷 의 시대 이다.네가 찾 으 면 기본적으로 네가 원 하 는 모든 자원 을 찾 을 수 있다.

2.웹 페이지 의 자원 을 어떻게 식별 합 니까?
위 에서 검색 한 바 이 두 그림 을 예 로 들 면이렇게 많은 내용 을 찾 았 으 니,당연히 수 동 으로 한 장 씩 저장 할 수 있 지만,이렇게 하 는 것 은 힘 들 고 힘 들 기도 하 다.너 는 당연히 프로그램 을 통 해 찾 은 자원 을 자동 으로 다운로드 하 기 를 바란다.코드 가 이 자원 들 을 식별 하려 면 코드 이 자원 들 이 어떤 특징 을 가지 고 있 는 지,웹 페이지 에서 어떻게 찾 는 지 알려 야 한다.
브 라 우 저의 디 버 깅 기능 을 엽 니 다.웹 페이지 에서 자원 을 다운로드 하고 싶 은 경 로 를 찾 아 보 세 요.아래 그림 과 같 습 니 다.만약 유사 한 자원 을 다운로드 해 야 한다 면,이러한 자원 주 소 를 식별 하 는 규칙 을 찾 아서 코드 를 알려 야 한다.

3.자원 다운로드 방법 1:
코드 는 간단 합 니 다.코드 를 직접 올 립 니 다.

from urllib.request import urlretrieve

urlretrieve("  URL", "./image.jpg")
 
url retrieve 함 수 를 통 해 URL 에 대응 하 는 그림 을 현재 폴 더(./)에 다운로드 하고 그림 을 image.jpg 라 고 명명 합 니 다.
4.자원 다운로드 방법 2:
아니면 코드 를 직접 보 시 겠 습 니까?

import requests

resource = requests.get("  URL")

with open("./image.jpg", mode="wb") as fh:

  fh.write(resource.content)
이 다운로드 방법 은 python 의 requests 라 이브 러 리 를 설치 해 야 합 니 다.기능 적 으로 다운로드 방법 과 같다.python 라 이브 러 리 의 설치 방법 은 pip 를 사용 하면 됩 니 다.간단 해,여기 다 잔소리 안 해.
5.자원 다운로드 방법 3:
코드 보기:

import requests

resource = requests.get("  URL", stream=True)

with open("./image.jpg", mode="wb") as fh:

  for chunk in resource.iter_content(chunk_size=100):

    fh.write(chunk)

이 방법 은 다운로드 방법 2 와 다른 점 은 get 방법 호출 시 인자[stream=True]를 사용 한 것 입 니 다.기록 한 파일 은 블록 으로 나 누 어 기록 합 니 다.
무슨 뜻 이 죠?
앞의 두 가지 방법 은 한 파일 을 모두 메모리 에 다운로드 한 후 하 드 디스크 파일 에 함께 쓰 는 것 이다.
방법 셋 째 는 일 정량의 다운로드(여기 서 100 바이트)를 한 후 하 드 디스크 파일 에 다 쓸 때 까지 기록 하 는 것 이다.
세 번 째 방법 은 대 용량 파일 을 다운로드 할 때 메모리 의 과도 한 사용 을 초래 하지 않 는 다 는 점 이다.
6.자원 다운로드 설명 1:
상기 코드 는 모두 이미지 자원 을 다운로드 하 는 것 을 예 로 들 지만 모든 다른 자원,예 를 들 어 문서,영화 등 다운로드 방식 은 같다.관건 은 웹 페이지 에 있 는 자원 에 대응 하 는 URL 주 소 를 정확하게 식별 해 야 정확 한 다운로드 가 가능 하 다 는 것 이다(일부 자원 은 상대 적 인 경로 나 암호 화 된 경로 이기 때문이다).
7.자원 다운로드 설명 2:
위의 예 에서 코드 는 모두 단일 자원 을 다운로드 한 것 이다.같은 웹 페이지 에서 여러 자원 을 다운로드 하려 면 다음 과 같이 생각 합 니 다.
1.자원 을 다운로드 할 URL 을 찾 아 자원 집합 을 형성한다.
2.다운로드 함수 의 자원 URL 과 저장 경 로 를 매개 변수 화 합 니 다.
3.자원 집합 을 옮 겨 다 니 며 다운로드 함 수 를 순환 호출 하여 여러 자원 다운로드 의 목적 을 달성 합 니 다.
결론:파 이 썬 파충류 다운로드 파일 에 대한 모든 지식 을 소개 합 니 다.읽 어 주 셔 서 감사합니다.

좋은 웹페이지 즐겨찾기