Python을 사용하여 PDF 파일 다운로드

이 문서에서는 Pythonrequests 라이브러리를 사용하여 PDF를 다운로드하는 방법에 대해 설명합니다.


  • 가져오기requests 라이브러리
  • URL을 요청하고 response 개체를 가져옵니다.
  • response 개체를 사용하여 PDF 파일을 가져오고 True를 반환합니다.
  • PDF를 다운로드할 수 없으면 False로 돌아갑니다.

  • 구현

    다음 프로그램은 제공된 URL에서 PDF 파일을 다운로드합니다.

    #!/usr/bin/env python3
    import os
    import requests
    def download_pdf_file(url: str) -> bool:
        """Download PDF from given URL to local directory.
        :param url: The url of the PDF file to be downloaded
        :return: True if PDF file was successfully downloaded, otherwise False.
        # Request URL and get response object
        response = requests.get(url, stream=True)
        # isolate PDF filename from URL
        pdf_file_name = os.path.basename(url)
        if response.status_code == 200:
            # Save in current working directory
            filepath = os.path.join(os.getcwd(), pdf_file_name)
            with open(filepath, 'wb') as pdf_object:
                print(f'{pdf_file_name} was successfully saved!')
                return True
            print(f'Uh oh! Could not download {pdf_file_name},')
            print(f'HTTP response status code: {response.status_code}')
            return False
    if __name__ == '__main__':
        # URL from which pdfs to be downloaded
        URL = ''


    the_raven.pdf was successfully saved!


    이 문서를 읽은 후 이제 Python의requests 라이브러리를 사용하여 PDF를 다운로드할 수 있습니다. 일부 웹사이트는 다른 웹사이트보다 데이터를 가져오기가 더 어려울 수 있습니다. PDF 파일을 다운로드할 수 없는 경우 HTTP response status codes을 분석하여 무엇이 잘못되었는지 확인하십시오. 이 글이 도움이 되셨다면 댓글을 남겨주세요.

    GitHub에서 사용 가능한 코드

    좋은 웹페이지 즐겨찾기