Tesseract 설치 및 사용법

Tesseract 본체를 설치합니다.

apt install tesseract-ocr libtesseract-dev tesseract-ocr-jpn

만약을 위해, 사용할 수 있는 언어를 조사합니다. 출력에 jpn 가 들어 있으면 문제 없습니다.

tesseract --list-langs

아래 이미지 데이터 test.png를 읽고 인식 결과를 파일 result.txt로 출력합니다.

tesseract ./test.png ./result -l jpn

내 환경에서 올바르게 인식되었습니다. 덧붙여 확장자는 마음대로 붙일 수 있습니다.

파이썬에서 Tesseract를 사용해보십시오.

파이썬에서 Tesseract를 사용할 수 있도록 pytesseract를 설치합니다.

pip install pytesseract

앞의 이미지 파일 test.jpg 를 똑같이 인식시켜 보자.

import pytesseract
from PIL import Image

result = pytesseract.image_to_string(Image.open('test.png'),lang='jpn') 
print(result)

이것도 올바르게 인식되었습니다.

이 문제에 관하여(문자 인식 소프트웨어의 Tesseract를 사용해 보았습니다.), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다 https://qiita.com/uneyamauneko/items/0a84e9a1c18a0e30626f

텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.

우수한 개발자 콘텐츠 발견에 전념 (Collection and Share based on the CC Protocol.)

개발자 우수 사이트 수집

개발자가 알아야 할 필수 사이트 100선 추천 우리는 당신을 위해 100개의 자주 사용하는 개발자 학습 사이트를 정리했습니다