Python 이 pdf 파일 을 통합 하 는 도구

4093 단어 Python합치다pdf
만약 PDF 파일 통합 도구 가 필요 하 다 면 이 글 은 귀하 의 요 구 를 충분히 만족 시 킬 수 있 습 니 다.안녕하세요.쓸데없는 소리 하지 마 세 요.이번 호 에 우 리 는 Python 을 이용 하여 여러 pdf 파일 을 하나 로 합 칩 니 다.우 리 는 코드 를 검증 하기 위해 5 개의 pdf 파일 을 미리 준비 했다.
在这里插入图片描述
코드:

import os
from PyPDF2 import PdfFileReader, PdfFileWriter

#   os   walk  ,           PDF  
#           PDF       
def getFileName(filedir):

    file_list = [os.path.join(root, filespath) \
                 for root, dirs, files in os.walk(filedir) \
                 for filespath in files \
                 if str(filespath).endswith('pdf')
                 ]
    return file_list if file_list else []

#           PDF  
def MergePDF(filepath, outfile):

    output = PdfFileWriter()
    outputPages = 0
    pdf_fileName = getFileName(filepath)

    if pdf_fileName:
        for pdf_file in pdf_fileName:
            print("  :%s"%pdf_file)

            #    PDF  
            input = PdfFileReader(open(pdf_file, "rb"))

            #    PDF       
            pageCount = input.getNumPages()
            outputPages += pageCount
            print("  :%d"%pageCount)

            #    page     output 
            for iPage in range(pageCount):
                output.addPage(input.getPage(iPage))

        print("       :%d."%outputPages)
        #      PDF  
        outputStream = open(os.path.join(filepath, outfile), "wb")
        output.write(outputStream)
        outputStream.close()
        print("PDF      !")

    else:
        print("       PDF  !")

#    
def main():
    file_dir = input('     Pdf    ').replace('/','//')#   PDF     
    outfile = "pick_me.pdf" #    PDF     
    MergePDF(file_dir, outfile)
    print('done')

main()
在这里插入图片描述
在这里插入图片描述
  5 개의 PDF 파일 이 합 쳐 진 것 을 볼 수 있 습 니 다.그러면 여기 서 끝 나 는 건 가요?물론 아 닙 니 다.코드 실행 이 PDF 파일 에 파일 형식 이 많 을 때,예 를 들 어 다 중 그림,워드 형식 등 은 다음 과 같은 오류 가 발생 할 수 있 습 니 다.
在这里插入图片描述
마지막 줄 이 틀 렸 다 는 뜻 은:
PyPDF2。utils.PdfReadError:키/Im 82,사전 의 바이트 0xc 0161 에 대해 여러 정의 가 있 습 니 다.
통속 적 으로 말 하면 다 의성 어 를 만 났 는데 절차 가 어떤 뜻 을 취해 야 할 지 모르겠다 는 것 이다.우 리 는 pdf.py 파일 에 눌 러 다음 그림 의 위 치 를 찾 았 다.
在这里插入图片描述
  엄격 한 모드 는 기본적으로 열 려 있 습 니 다.저 희 는 False 로 바 꿉 니 다.
구조 방법:
PyPDF2.PdfFileReader(stream,strict = True,warndest = None,overwriteWarnings = True)
stream:File 대상 이나 File 대상 과 유사 한 표준 읽 기와 찾기 방법 을 지원 하 는 대상 은 PDF 파일 경 로 를 나타 내 는 문자열 일 수도 있 습 니 다.
strict(bool):사용자 가 사용 하 는 문 제 를 경고 해 야 하 는 지 확인 하고 수정 가능 한 문제 도 치 명 적 입 니 다.기본 값 은 True 입 니 다.
warndest:경 고 를 기록 하 는 대상(기본 값 은 sys.stderr)
overwriteWarnings(bool):warnings.py 가 사용자 정의 로 Python 모듈 을 덮어 쓸 지 확인 합 니 다(기본 값 은 True)
우 리 는 프로그램 을 다시 실행 합 니 다.
在这里插入图片描述
  폴 더 를 열 면 우리 의 파일 이 합 쳐 진 것 을 볼 수 있 고 열 린 후의 형식 도 잘못 되 지 않 았 습 니 다.
그럼 문제 해결.
在这里插入图片描述
*8195:만약 에 PDF 통합 도구 코드 를 직접 가 져 가 야 한다 면 pypdf 2 라 는 실 용적 인 라 이브 러 리 를 배우 고 이 코드 를 개선 하여 자신의 상황 에 맞 게 하 기 를 바 랍 니 다.
파 이 썬 통합 pdf 파일 에 관 한 이 글 은 여기까지 소개 되 었 습 니 다.더 많은 파 이 썬 통합 pdf 파일 내용 은 이전 글 을 검색 하거나 아래 의 관련 글 을 계속 찾 아 보 세 요.앞으로 도 많은 응원 부 탁 드 리 겠 습 니 다!

좋은 웹페이지 즐겨찾기