Python으로 모든 PDF에서 오디오북 만들기

모든 PDF에서 Python으로 오디오북을 만들 수 있다는 것을 알고 계셨습니까? 멋지지 않나요?
이 빠른 자습서에서는 Python으로 오디오북을 만드는 방법을 보여 드리겠습니다.

이 예에서는 PyPDF2 및 pyttsx3 를 사용할 것입니다.

PyPDF2은 PDF 툴킷으로 구축된 순수 Python 라이브러리입니다. 다음을 수행할 수 있습니다.

문서 정보 추출(제목, 저자, …)

문서를 페이지별로 분할

문서를 페이지별로 병합

페이지 자르기

여러 페이지를 단일 페이지로 병합

PDF 파일 암호화 및 해독

등!

Pure-Python이기 때문에 외부 라이브러리에 대한 종속성 없이 모든 Python 플랫폼에서 실행되어야 합니다. 또한 파일 스트림이 아닌 StringIO 개체에서 완전히 작동하여 메모리에서 PDF를 조작할 수 있습니다. 따라서 PDF를 관리하거나 조작하는 웹 사이트에 유용한 도구입니다.

Pyttsx3은 Python의 텍스트 음성 변환 라이브러리입니다. 대체 라이브러리와 달리 오프라인에서 작동하며 Python 2 및 3과 호환됩니다.

코드로 이동해 보겠습니다.

먼저 종속성을 가져와야 합니다.

import PyPDF2
import pyttsx3

그런 다음 pdf를 열어야 합니다.

pdf_file =  open('test.pdf', 'rb')

여기서 mode='rb'는 파일을 읽기 위해 바이너리 형식으로 여는 데 사용됩니다.

PDF 파일 리더를 정의합니다.

pdf_read = PyPDF2.PdfFileReader(pdf_file)

그런 다음 PDF 파일의 페이지 수를 지정해야 합니다.

num_pages = pdf_read.numPages

그런 다음 init를 정의하고 print도 할 수 있습니다.

engine = pyttsx3.init()
print('Read PDF')

그런 다음 모든 페이지를 하나씩 읽는 루프를 정의합니다.

for n in range(0, num_pages):
    page = pdf_read.getPage(n)
    text = page.extractText()
    x = n + 1
    print(f"Reading page {x}/{num_pages}.")
    engine.say(text)
    engine.save_to_file(text, 'book.mp3')
    engine.runAndWait()

코드의 이 부분은 이 PDF 파일에서 번호로 페이지를 검색하고, 페이지에서 텍스트를 추출하고, 페이지에서 텍스트를 읽습니다. 또한 우리는 mp3 파일로 저장합니다.

모두 감사합니다.

Reference

이 문제에 관하여(Python으로 모든 PDF에서 오디오북 만들기), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다 https://dev.to/stokry/build-your-audiobook-from-any-pdf-with-python-3807

텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.

우수한 개발자 콘텐츠 발견에 전념 (Collection and Share based on the CC Protocol.)

좋은 웹페이지 즐겨찾기

개발자 우수 사이트 수집

개발자가 알아야 할 필수 사이트 100선 추천 우리는 당신을 위해 100개의 자주 사용하는 개발자 학습 사이트를 정리했습니다