Python 이 pdf 파일 을 통합 하 는 도구
코드:
import os
from PyPDF2 import PdfFileReader, PdfFileWriter
# os walk , PDF
# PDF
def getFileName(filedir):
file_list = [os.path.join(root, filespath) \
for root, dirs, files in os.walk(filedir) \
for filespath in files \
if str(filespath).endswith('pdf')
]
return file_list if file_list else []
# PDF
def MergePDF(filepath, outfile):
output = PdfFileWriter()
outputPages = 0
pdf_fileName = getFileName(filepath)
if pdf_fileName:
for pdf_file in pdf_fileName:
print(" :%s"%pdf_file)
# PDF
input = PdfFileReader(open(pdf_file, "rb"))
# PDF
pageCount = input.getNumPages()
outputPages += pageCount
print(" :%d"%pageCount)
# page output
for iPage in range(pageCount):
output.addPage(input.getPage(iPage))
print(" :%d."%outputPages)
# PDF
outputStream = open(os.path.join(filepath, outfile), "wb")
output.write(outputStream)
outputStream.close()
print("PDF !")
else:
print(" PDF !")
#
def main():
file_dir = input(' Pdf ').replace('/','//')# PDF
outfile = "pick_me.pdf" # PDF
MergePDF(file_dir, outfile)
print('done')
main()
5 개의 PDF 파일 이 합 쳐 진 것 을 볼 수 있 습 니 다.그러면 여기 서 끝 나 는 건 가요?물론 아 닙 니 다.코드 실행 이 PDF 파일 에 파일 형식 이 많 을 때,예 를 들 어 다 중 그림,워드 형식 등 은 다음 과 같은 오류 가 발생 할 수 있 습 니 다.
마지막 줄 이 틀 렸 다 는 뜻 은:
PyPDF2。utils.PdfReadError:키/Im 82,사전 의 바이트 0xc 0161 에 대해 여러 정의 가 있 습 니 다.
통속 적 으로 말 하면 다 의성 어 를 만 났 는데 절차 가 어떤 뜻 을 취해 야 할 지 모르겠다 는 것 이다.우 리 는 pdf.py 파일 에 눌 러 다음 그림 의 위 치 를 찾 았 다.
엄격 한 모드 는 기본적으로 열 려 있 습 니 다.저 희 는 False 로 바 꿉 니 다.
구조 방법:
PyPDF2.PdfFileReader(stream,strict = True,warndest = None,overwriteWarnings = True)
stream:File 대상 이나 File 대상 과 유사 한 표준 읽 기와 찾기 방법 을 지원 하 는 대상 은 PDF 파일 경 로 를 나타 내 는 문자열 일 수도 있 습 니 다.
strict(bool):사용자 가 사용 하 는 문 제 를 경고 해 야 하 는 지 확인 하고 수정 가능 한 문제 도 치 명 적 입 니 다.기본 값 은 True 입 니 다.
warndest:경 고 를 기록 하 는 대상(기본 값 은 sys.stderr)
overwriteWarnings(bool):warnings.py 가 사용자 정의 로 Python 모듈 을 덮어 쓸 지 확인 합 니 다(기본 값 은 True)
우 리 는 프로그램 을 다시 실행 합 니 다.
폴 더 를 열 면 우리 의 파일 이 합 쳐 진 것 을 볼 수 있 고 열 린 후의 형식 도 잘못 되 지 않 았 습 니 다.
그럼 문제 해결.
*8195:만약 에 PDF 통합 도구 코드 를 직접 가 져 가 야 한다 면 pypdf 2 라 는 실 용적 인 라 이브 러 리 를 배우 고 이 코드 를 개선 하여 자신의 상황 에 맞 게 하 기 를 바 랍 니 다.
파 이 썬 통합 pdf 파일 에 관 한 이 글 은 여기까지 소개 되 었 습 니 다.더 많은 파 이 썬 통합 pdf 파일 내용 은 이전 글 을 검색 하거나 아래 의 관련 글 을 계속 찾 아 보 세 요.앞으로 도 많은 응원 부 탁 드 리 겠 습 니 다!
이 내용에 흥미가 있습니까?
현재 기사가 여러분의 문제를 해결하지 못하는 경우 AI 엔진은 머신러닝 분석(스마트 모델이 방금 만들어져 부정확한 경우가 있을 수 있음)을 통해 가장 유사한 기사를 추천합니다:
Python의 None과 NULL의 차이점 상세 정보그래서 대상 = 속성 + 방법 (사실 방법도 하나의 속성, 데이터 속성과 구별되는 호출 가능한 속성 같은 속성과 방법을 가진 대상을 클래스, 즉 Classl로 분류할 수 있다.클래스는 하나의 청사진과 같아서 하나의 ...
텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
CC BY-SA 2.5, CC BY-SA 3.0 및 CC BY-SA 4.0에 따라 라이센스가 부여됩니다.