python 은 Tesseract 를 이용 하여 인증 코드 를 식별 하 는 방법 예시

자동화 로그 인 이 든 파충류 든 인증 코드 를 돌 릴 수 없 으 니 이번 에는 python 에서 광학 식별 인증 코드 모듈 tesserocrpytesseract 에 대해 이야기 하 자.tesserocrpytesseract 은 Python 의 OCR 식별 라 이브 러 리 이지 만 사실은 tesseract 에 대한 Python API 패키지 이 고 pytesseract 은 Google 의 Tesseract-OCR 엔진 패키지 입 니 다.그래서 그들의 핵심 은 tesseract 이 므 로 tesserocr 을 설치 하기 전에 우 리 는 먼저 tesseract 을 설치 해 야 한다.
다운로드 설치
다운로드 주소:https://digi.bib.uni-mannheim.de/tesseract/tesseract-ocr-w64-setup-v4.0.0.20181030.exe
다운로드 가 완 료 된 후 더 블 클릭 으로 설치 하면 Additional language data(download) 옵션 을 선택 하여 OCR 인식 이 지원 하 는 언어 팩 을 설치 할 수 있 습 니 다.그러나 언어 팩 을 다운로드 하 는 것 이 너무 느 립 니 다.우 리 는 https://github.com/tesseract-ocr/tessdata/ 에서 zip 의 언어 팩 압축 파일 을 직접 다운로드 하고 압축 을 푼 후에 tessdata-master 의 파일 을 Tesseract 의 설치 디 렉 터 리 C:\Program Files (x86)\Tesseract-OCR\tessdata 디 렉 터 리 로 복사 할 수 있 습 니 다.마지막 으로 환경 변 수 를 설정 합 니 다.우 리 는 C:\Program Files (x86)\Tesseract-OCR 을 환경 변수 에 추가 할 것 이다.명령 프롬프트 에 들 어가 tesseract 을 입력 하여 다음 그림 결 과 를 표시 하고 설정 이 완료 되 었 음 을 설명 합 니 다.

설 치 된 언어 팩 보기:tesseract --list-langs
영어 나 다른 문자 가 들 어 있 는 167 가지 언어 패 키 지 를 설치 한 것 을 보 여 줍 니 다.
테스트
실험 용 QR 코드

기본 사용 문법tesseract image.png result(tesseract 그림 이름 생 성 파일 이름)
결실

결 과 를 보면 P,2,X 가 식별 되 었 으 나 C 를 G 로 식별 하여 식별 도가 비교적 높 았 고 다음은 python 에서 의 사용 을 보 았 다.
python tesseract 도입
python 에서 pip 명령 을 사용 하면 다운로드 설치 완료 pip install pytesseract식별 인증번호 스 크 립 트

import pytesseract
from PIL import Image
im=Image.open('pin.png')
print(pytesseract.image_to_string(im))
결실

이렇게 식별 한 결과 역시 윗글 과 마찬가지 로 개별 문자 인식 이 정확 하지 않다.
영상 처리
현재 사이트 의 QR 코드 디자인 은 일반적으로 복잡 하기 어렵 고 직접 식별 하면 식별 하기 어렵다.아래 의 이 코드 는 그 레이스 케 일 처리 와 이치 화 이다.

import pytesseract
from PIL import Image
im=Image.open('5.jpg')
#      
im=im.convert('L')
#        
threshold=150
table=[]
for i in range(256):
 if i<threshold:
  table.append(0)
 else:
  table.append(1)
#            ,1      ,0    
im=im.point(table,"1")
im.show()
print(pytesseract.image_to_string(im))
원 도

재 와 이치 화 후

이상 이 바로 본 고의 모든 내용 입 니 다.여러분 의 학습 에 도움 이 되 고 저 희 를 많이 응원 해 주 셨 으 면 좋 겠 습 니 다.

좋은 웹페이지 즐겨찾기