Python OCR 인식 을 실현 하 는 pytesseract 사례 상세 설명

3220 단어 pythonOCRpytesseract
Python OCR 인식 실현:pytesseract
Python 은 그림 에 있 는 문자 인식,즉 OCR 인식 을 자주 사용 합 니 다.완전한 코드 는 간단 하고 다음 줄 만 있 으 면 되 지만 실제 사용 시 환경 설정 에 오류 가 발생 하기 쉽 습 니 다.

from PIL import Image
import pytesseract
 
text = pytesseract.image_to_string(Image.open('/Users/alice/Documents/Develop/PythonCode/textinphoto.PNG'))
print(text)
따라서 사용 하기 전에 pillow 와 pytesseract 의존 팩 을 설치 해 야 합 니 다.
그러나 실행 중 오류 가 발생 했 습 니 다.raise Tesseract NotFound 오류()
pytesseract.pytesseract.TesseractNotFoundError: tesseract is not installed or it's not in your path
tesseract 가 설치 되 어 있 지 않 은 다음 pip 3 install tesseract 를 사용 한 후에 도 오류 가 발생 했 기 때 문 입 니 다.그림 참조:

alicedembp:~ alice$ pip3 install tesseract
Requirement already satisfied: tesseract in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (0.1.3)
alicedembp:~ alice$ tesseract
-bash: tesseract: command not found
사용 할 수 없습니다.위로 많은 튜 토리 얼 을 찾 았 습 니 다.brew 로 설치 하 겠 다 고 해서 해결 할 수 있 었 습 니 다.절 차 는 다음 과 같 습 니 다.
먼저 brew 를 설치 하 다.

alicedembp:~ alice$ ruby -e "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/master/install)"
  • brew 를 사용 하여 leptonica 를 설치 합 니 다
  • 
    alicedembp:~ alice$ brew install leptonica
  • brew 를 사용 하여 tesseract 를 설치 합 니 다
  • 
    alicedembp:~ alice$ brew install tesseract
    4.567917.설치 에 성 공 했 습 니 다.명령 행 tesseract-v 방식 으로 성공 여 부 를 확인 하고 버 전 번호 가 나타 나 면 설치 성공 입 니 다
    
    alicedembp:~ alice$ tesseract
    Usage:
      tesseract --help | --help-extra | --version
      tesseract --list-langs
      tesseract imagename outputbase [options...] [configfile...]
     
    OCR options:
      -l LANG[+LANG]        Specify language(s) used for OCR.
    NOTE: These options must occur before any configfile.
     
    Single options:
      --help                Show this help message.
      --help-extra          Show extra help for advanced users.
      --version             Show version information.
      --list-langs          List available languages for tesseract engine.
     
    alicedembp:~ alice$ tesseract -v
    tesseract 4.0.0
     leptonica-1.78.0
      libgif 5.1.4 : libjpeg 9c : libpng 1.6.36 : libtiff 4.0.10 : zlib 1.2.11 : libwebp 1.0.2 : libopenjp2 2.3.1
     Found AVX2
     Found AVX
     Found SSE
    다음은 바로 사용 할 수 있 습 니 다.다음 코드 를 사용 하 십시오.
    
    alicedembp:~ alice$ tesseract /Users/alice/Documents/Develop/PythonCode/textinphoto.png /Users/alice/Documents/Develop/PythonCode/output.txt
    textinphoto.PNG 그림 을 열 고 output.txt 에 텍스트 를 출력 합 니 다.그림 은 다음 과 같 습 니 다.

    실행 에 성공 하여 output.txt 문 서 를 만 들 었 습 니 다.안의 텍스트 는 그림 에서 인식 되 는 텍스트 입 니 다.

    파 이 썬 이 OCR 인식 을 실현 하 는 pytesseract 사례 에 대한 상세 한 설명 은 여기까지 입 니 다.더 많은 python OCR 인식 에 관 한 pytesseract 내용 은 우리 의 이전 글 을 검색 하거나 아래 의 관련 글 을 계속 조회 하 시기 바 랍 니 다.앞으로 많은 응원 바 랍 니 다!

    좋은 웹페이지 즐겨찾기