Flask와 PyPDF2를 사용하여 PDF를 텍스트로 변환하는 웹 앱 만들기
Flask를 사용하여 로컬에서 업로드한 PDF 파일을 텍스트로 변환하는 응용 프로그램을 작곡합니다.
pip install PyPDF2
준비는 이 정도입니다.
실태
별도로 바뀐 것은 하지 않습니다.
index.pyimport os
import PyPDF2
from flask import Flask, render_template, request, redirect, url_for, send_from_directory, session
from werkzeug import secure_filename
app = Flask(__name__)
UPLOAD_FOLDER = './uploads'
ALLOWED_EXTENSIONS = set(['pdf'])
app.config['UPLOAD_FOLDER'] = UPLOAD_FOLDER
app.config['SECRET_KEY'] = os.urandom(24)
def allowed_file(filename):
return '.' in filename and \
filename.rsplit('.', 1)[1] in ALLOWED_EXTENSIONS
@app.route('/')
def index():
return render_template('pdf.html')
@app.route('/show_pdf', methods=['GET', 'POST'])
def show_pdf():
if request.method == 'POST':
send_data = request.files['send_data']
if send_data and allowed_file(send_data.filename):
filename = secure_filename(send_data.filename)
send_data.save(os.path.join(app.config['UPLOAD_FOLDER'], filename))
pdf_file_obj = open('uploads/' + filename, 'rb')
pdf_reader = PyPDF2.PdfFileReader(pdf_file_obj)
page_obj = pdf_reader.getPage(0)
result = page_obj.extractText()
return render_template('pdf.html', result=result)
@app.route('/uploads/<filename>')
def uploaded_file(filename):
return send_from_directory(app.config['UPLOAD_FOLDER'], filename)
if __name__ == '__main__':
app.debug = True
app.run()
pdf.html{% extends "base.html" %}
{% block content %}
<form method="post" action="{{ url_for('show_pdf') }}" enctype="multipart/form-data">
<input type="file" id="send_data" name="send_data">
<input type="submit" value="送信">
</fomr>
<div>
{% if result %}
{% for i in result %}
{{ i }}
{% endfor %}
{% endif %}
</div>
{% endblock %}
움직여 보자
이번에는 Pages에서 만든 템플릿을 사용해 보겠습니다.
이런 느낌의 PDF 파일을 로컬에 test.pdf로 내보냅니다.
응용 프로그램 화면은 간단합니다. 우선 업로드해 보겠습니다.
여러가지 하지 않으면 안 되는 것이 있군요・・・.
Reference
이 문제에 관하여(Flask와 PyPDF2를 사용하여 PDF를 텍스트로 변환하는 웹 앱 만들기), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다
https://qiita.com/Gen6/items/bc0b459d8a6508040e61
텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념
(Collection and Share based on the CC Protocol.)
import os
import PyPDF2
from flask import Flask, render_template, request, redirect, url_for, send_from_directory, session
from werkzeug import secure_filename
app = Flask(__name__)
UPLOAD_FOLDER = './uploads'
ALLOWED_EXTENSIONS = set(['pdf'])
app.config['UPLOAD_FOLDER'] = UPLOAD_FOLDER
app.config['SECRET_KEY'] = os.urandom(24)
def allowed_file(filename):
return '.' in filename and \
filename.rsplit('.', 1)[1] in ALLOWED_EXTENSIONS
@app.route('/')
def index():
return render_template('pdf.html')
@app.route('/show_pdf', methods=['GET', 'POST'])
def show_pdf():
if request.method == 'POST':
send_data = request.files['send_data']
if send_data and allowed_file(send_data.filename):
filename = secure_filename(send_data.filename)
send_data.save(os.path.join(app.config['UPLOAD_FOLDER'], filename))
pdf_file_obj = open('uploads/' + filename, 'rb')
pdf_reader = PyPDF2.PdfFileReader(pdf_file_obj)
page_obj = pdf_reader.getPage(0)
result = page_obj.extractText()
return render_template('pdf.html', result=result)
@app.route('/uploads/<filename>')
def uploaded_file(filename):
return send_from_directory(app.config['UPLOAD_FOLDER'], filename)
if __name__ == '__main__':
app.debug = True
app.run()
{% extends "base.html" %}
{% block content %}
<form method="post" action="{{ url_for('show_pdf') }}" enctype="multipart/form-data">
<input type="file" id="send_data" name="send_data">
<input type="submit" value="送信">
</fomr>
<div>
{% if result %}
{% for i in result %}
{{ i }}
{% endfor %}
{% endif %}
</div>
{% endblock %}
이번에는 Pages에서 만든 템플릿을 사용해 보겠습니다.
이런 느낌의 PDF 파일을 로컬에 test.pdf로 내보냅니다.
응용 프로그램 화면은 간단합니다. 우선 업로드해 보겠습니다.
여러가지 하지 않으면 안 되는 것이 있군요・・・.
Reference
이 문제에 관하여(Flask와 PyPDF2를 사용하여 PDF를 텍스트로 변환하는 웹 앱 만들기), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다 https://qiita.com/Gen6/items/bc0b459d8a6508040e61텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념 (Collection and Share based on the CC Protocol.)