tesseract 기반 문자 식별

1872 단어 인공지능
tesseract는 구글에서 개발한 그림에 대한ocr인식 소스 소프트웨어로 사용할 때 주로tesseract를 설치하고 음성 라이브러리를 다운로드하며 음성 라이브러리의 몇 가지 부분을 훈련하는 것을 포함한다.그 설치 방식과 다운로드 방식은 현재 많은 설명을 하지 않고 있다.
1. tesseract 기본 조작 과정
1. 설치 과정은 자신이 선택한 버전을 주의해야 한다. 테슬레이트-4의 버전은 정확도가 높아졌지만 설정이 지원되지 않는 화이트리스트, 테슬레이트-3과 테슬레이트-5의 버전 지원이 필요하다. 또한 윈도우즈를 기반으로 설치할 때 설치한 후에 환경 변수를 설정해야 한다. 두 부분을 포함한다.구성.exe 경로, 2.언어에 대한 경로 설정 TESSERDATAPREFIX, 위치traineddata 파일의 힘.음성을 다운로드할 때 해당 버전의 음성 패키지를 찾아야 합니다. 음성 다운로드 링크는 다음과 같습니다.https://github.com/tesseract-ocr/tessdata.글꼴 훈련에 사용되는 도구는 jTessBoxEditorFX-2.0.1입니다.zip.이 도구는 글씨체를 식별한 다음에 식별 결과에 따라 표시를 하고 새로운 글씨체를 생성하는 훈련을 할 수 있지만 재사용 과정에서 환경 변수를 소프트웨어 내부에 포함된 것으로 바꾸는 데 주의해야 한다.exe와 언어 패키지에 대응하는 경로입니다.
2. 사용:tesseract 사용은 비교적 간단하고 명령줄을 직접 사용하여 tesseract filename outputname -l 언어 이름 -psm 숫자(기본값은 3)config(프로필)를 통과할 수 있다.기본 언어 이름은 영어이고, 기본 출력 파일 형식은 txt입니다.python을 기반으로 그림을 검사할 수 있으며, 사용할 때pytesseract를 설치하는 것 이외에tesseract 플러그인과 대응하는 언어 패키지를 설치해야 한다.다른 호출 인터페이스는pytesseract입니다.image_to_string (image), string 형식의 결과를 되돌려줍니다.python 구현 방법은 다음과 같습니다.
tessdata_dir_config = '--tessdata-dir "D:\Program Files\Tesseract-OCR\\tessdata\" ' \
                      '--psm 6'
pytesseract.pytesseract.tesseract_cmd = 'D:\Program Files\Tesseract-OCR\\tesseract.exe'
card_no = pytesseract.image_to_string(image, lang="chi_sim", config=tessdata_dir_config)

여기서 반환된 카드no는tesseract 검사 결과입니다.
3. 정확도 향상:tesseract는 배경이 비교적 빠르고 깨끗하며 문자와 배경이 비교적 뚜렷한 문자, 예를 들어 흰 바탕에 검은 글자나 검은 바탕에 흰 글자를 식별한다.그림을 입력할 때 내부 시스템도 그림을 이치화 처리하지만 처리 방식이 비교적 통일되어 있다고 할 수 없다.따라서 예를 들어 정확도를 높이면 그림을 입력하기 전에 먼저 그림을 이치화 처리할 수 있다.처음 이외에도 재단하는 방식으로 그림 속의 문자를 재단할 수 있어 배경의 방해를 더욱 제거할 수 있다.
4. EAST모델을 이용하여 문자를 검측하고 검측된 문자를 재단한 다음에 재단된 그림을 이치화하여tesseract를 사용하여 검측할 수 있다. 이 방법의 장점은 문자를 포함하는 구역이 작고 이치화 처리에 편리하다는 것이다.
 
 

좋은 웹페이지 즐겨찾기