Python 3.6 tesseract-ocr 를 사용 하 는 정확 한 방법
2007 단어 pythontesseract-orc
tesseract 는 매우 좋 은 OCR 엔진 으로 현재 의 문 제 는 최신 중국어 자료 가 상대 적 으로 적 고 유행 이 지 났 으 며 정확 하지 않 은 정보 가 많다 는 것 이다.
tesseract 는 google 이 지원 하 는 오픈 소스 ocr 프로젝트 입 니 다.프로젝트 주소:https://github.com/tesseract-ocr/tesseract현재 최신 소스 코드 는 여기에서 다운로드 할 수 있 습 니 다.
실제 tesseract ocr 를 사용 하 는 방법 도 두 가지 가 있 습 니 다.1.동적 라 이브 러 리 방식 libtesseract 2.실행 프로그램 방식 tesseract.exe
환경.
1.tesseract-orc
2.pytesseract
pip install pytesseract
환경 설정1.tesseract-orc 경로 설정
기본적으로 tesseract-orc 는 시스템 의 path 경로 에 추가 되 지 않 습 니 다.사용 할 때
FileNotFoundError: [WinError 2]
시스템 에서 지정 한 파일 을 찾 을 수 없 는 오류 가 발생 합 니 다.해결 방법:
다운로드 한 기본 훈련 집 도 시스템 경로 에 추가 되 지 않 아 오류 가 발생 할 수 있 습 니 다.
pytesseract.pytesseract.TesseractError: (1, 'Error opening data file \\Program Files (x86)\\Tesseract-OCR\\tessdata/chi_sim.traineddata')
해결 방법:환경 변수 설정
TESSDATA_PREFIX
C:\Program Files (x86)\Tesseract-OCR\tessdata
인 스 턴 스 프로그램
import pytesseract
from PIL import Image
image = Image.open('test.png')
code = pytesseract.image_to_string(image)
print(code)
더 많은 참고:https://pypi.python.org/pypi/pytesseract총결산
이상 은 이 글 의 모든 내용 입 니 다.본 고의 내용 이 여러분 의 학습 이나 업무 에 어느 정도 참고 학습 가 치 를 가지 기 를 바 랍 니 다.여러분 의 저희 에 대한 지지 에 감 사 드 립 니 다.더 많은 내용 을 알 고 싶다 면 아래 링크 를 보 세 요.
이 내용에 흥미가 있습니까?
현재 기사가 여러분의 문제를 해결하지 못하는 경우 AI 엔진은 머신러닝 분석(스마트 모델이 방금 만들어져 부정확한 경우가 있을 수 있음)을 통해 가장 유사한 기사를 추천합니다:
로마 숫자를 정수로 또는 그 반대로 변환그 중 하나는 로마 숫자를 정수로 변환하는 함수를 만드는 것이었고 두 번째는 그 반대를 수행하는 함수를 만드는 것이었습니다. 문자만 포함합니다'I', 'V', 'X', 'L', 'C', 'D', 'M' ; 문자열이 ...
텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
CC BY-SA 2.5, CC BY-SA 3.0 및 CC BY-SA 4.0에 따라 라이센스가 부여됩니다.