tesseract 실행 코드 과정 에서 발생 한 문제

2640 단어 그래 픽 처리
1.pytesseract.pytesseract.TesseractNotFoundError: tesseract is not installed or it’s not in your path
해결 방법:
방법 1 [추천]: tesseract. exe 를 환경 변수 PATH 에 추가 하고,
예 를 들 어 D: \ \ Tesseract - OCR, 기본 경 로 는 C: \ Program Files (x86) \ \ Tesseract - OCR 입 니 다.
메모: 환경 변 수 를 적용 하기 위해 서 는 cmd 창 을 닫 거나 pycharm 등 id 를 닫 고 다시 시작 해 야 합 니 다.
방법 2: pytesseract. py 파일 을 수정 하고 tesseract. exe 설치 경 로 를 지정 합 니 다.
# CHANGE THIS IF TESSERACT IS NOT IN YOUR PATH, OR IS NAMED DIFFERENTLY
tesseract_cmd = 'C:\\Program Files (x86)\\Tesseract-OCR\\tesseract.exe‘

방법 3: 실제 실행 코드 에서 지정
다음 코드 추가 하기;코드 에 tesseract. exe 경 로 를 추가 합 니 다.
pytesseract.pytesseract.tesseract_cmd = 'D:\
n\Tesseract-OCR\\tesseract.exe'

상기 세 가지 방법 을 모두 시도 해 보 았 는데, 마지막 에 세 번 째 방법 이 효과 가 있 음 을 발견 하 였 다!
테스트 코드 첨부:
try:
    import Image
except ImportError:
    from PIL import Image
    import pytesseract

    pytesseract.pytesseract.tesseract_cmd = 'D:\\Tesseract-OCR\\tesseract.exe'
    print('        :')
    print(pytesseract.image_to_string(Image.open('18.png')))

    # print(pytesseract.image_to_string(Image.open('test-european.jpg'), lang='fra'))

2.pytesseract.pytesseract.TesseractError: (1, ‘Error opening data file n\Tesseract-OCR\eng.traineddata Please make sure the TESSDATA_PREFIX environment variable is set to your “tessdata” directory. Failed loading language ‘eng’ Tesseract couldn’t load any languages! Could not initialize tesseract.’)
해결 방법:
다음 코드 추가 하기;코드 에 tesseract. exe 경 로 를 추가 합 니 다.
os.environ['TESSDATA_PREFIX'] = 'D:\
n\Tesseract-OCR\\tessdata'

3.Failed loading language ‘eng’ Tesseract couldn’t load any languages! Could not initialize tesseract.
해결 방법:
tesseract 를 다시 설치 합 니 다. 제 컴퓨터 에 설 치 된 3.6, 4.0 을 설치 한 후에 상기 2 의 문제 가 발생 한 다음 에 2 의 해결 방법 에 따라 해결 하면 코드 가 성공 적 으로 실 행 될 수 있 습 니 다!
http://digi.bib.uni-mannheim.de/tesseract/tesseract-ocr-setup-4.00.00dev.exe

좋은 웹페이지 즐겨찾기