Python 이 같은 폴 더 아래 의 모든 PDF 파일 을 통합 하 는 방법 예시

2913 단어 PythonPDF 파일
이 실례 는 Python 이 같은 폴 더 아래 의 모든 PDF 파일 을 통합 하 는 방법 을 설명 한다.여러분 께 참고 하도록 공유 하 겠 습 니 다.구체 적 으로 는 다음 과 같 습 니 다.
수요 설명
왕 이 클 라 우 드 수업 의 오 은 달 이 무료 로 깊이 있 게 공부 한 pdf 문 서 를 다운로드 하 였 으 나 매 절 마다 pdf 입 니 다.저 는 이 PDF 문 서 를 한 폴 더 에 두 고 PDF 파일 로 통합 하고 싶 습 니 다.그래서 python 프로그램 을 써 서 이 문 제 를 잘 해결 했다.
2.데이터 형식

3.합병 효과

4.python 코드 구현

# -*- coding:utf-8*-
import sys
reload(sys)
sys.setdefaultencoding('utf-8')
import os
import os.path
from pyPdf import PdfFileReader,PdfFileWriter
import time
time1=time.time()
#   os  walk  ,          pdf  
######################            PDF   #######################
def getFileName(filepath):
  file_list = []
  for root,dirs,files in os.walk(filepath):
    for filespath in files:
      # print(os.path.join(root,filespath))
      file_list.append(os.path.join(root,filespath))
  return file_list
##########################           PDF  ########################
def MergePDF(filepath,outfile):
  output=PdfFileWriter()
  outputPages=0
  pdf_fileName=getFileName(filepath)
  for each in pdf_fileName:
    print each
    #    pdf  
    input = PdfFileReader(file(each, "rb"))
    #   pdf      ,          pyPdf
    if input.isEncrypted == True:
      input.decrypt("map")
    #    pdf       
    pageCount = input.getNumPages()
    outputPages += pageCount
    print pageCount
    #    page     output 
    for iPage in range(0, pageCount):
      output.addPage(input.getPage(iPage))
  print "All Pages Number:"+str(outputPages)
  #    pdf  
  outputStream=file(filepath+outfile,"wb")
  output.write(outputStream)
  outputStream.close()
  print "finished"
if __name__ == '__main__':
  file_dir = r'D:/course/'
  out=u"   .pdf"
  MergePDF(file_dir,out)
  time2 = time.time()
  print u'    :' + str(time2 - time1) + 's'

"D:\\Program Files\Python 27\\python.exe"D:/PhycharmProjects/learn 2017/여러 PDF 파일 을 통합 합 니 다.py
D:/course/C1W1L01 Welcome.pdf
3
D:/course/C1W1L02 WhatIsNN.pdf
4
D:/course/C1W1L03 SupLearnWithNN.pdf
4
D:/course/C1W1L04 WhyIsDLTakingOff.pdf
3
D:/course/C1W1L05 AboutThisCourse.pdf
3
D:/course/C1W1L06 CourseResources.pdf
3
All Pages Number:20
finished
총 소모 시간:0.128000020981 s
Process finished with exit code 0
더 많은 Python 관련 내용 에 관심 이 있 는 독 자 는 본 사이트 의 주 제 를 볼 수 있 습 니 다.
본 논문 에서 말 한 것 이 여러분 의 Python 프로 그래 밍 에 도움 이 되 기 를 바 랍 니 다.

좋은 웹페이지 즐겨찾기