tesseract 기반 문자 식별
1872 단어 인공지능
1. tesseract 기본 조작 과정
1. 설치 과정은 자신이 선택한 버전을 주의해야 한다. 테슬레이트-4의 버전은 정확도가 높아졌지만 설정이 지원되지 않는 화이트리스트, 테슬레이트-3과 테슬레이트-5의 버전 지원이 필요하다. 또한 윈도우즈를 기반으로 설치할 때 설치한 후에 환경 변수를 설정해야 한다. 두 부분을 포함한다.구성.exe 경로, 2.언어에 대한 경로 설정 TESSERDATAPREFIX, 위치traineddata 파일의 힘.음성을 다운로드할 때 해당 버전의 음성 패키지를 찾아야 합니다. 음성 다운로드 링크는 다음과 같습니다.https://github.com/tesseract-ocr/tessdata.글꼴 훈련에 사용되는 도구는 jTessBoxEditorFX-2.0.1입니다.zip.이 도구는 글씨체를 식별한 다음에 식별 결과에 따라 표시를 하고 새로운 글씨체를 생성하는 훈련을 할 수 있지만 재사용 과정에서 환경 변수를 소프트웨어 내부에 포함된 것으로 바꾸는 데 주의해야 한다.exe와 언어 패키지에 대응하는 경로입니다.
2. 사용:tesseract 사용은 비교적 간단하고 명령줄을 직접 사용하여 tesseract filename outputname -l 언어 이름 -psm 숫자(기본값은 3)config(프로필)를 통과할 수 있다.기본 언어 이름은 영어이고, 기본 출력 파일 형식은 txt입니다.python을 기반으로 그림을 검사할 수 있으며, 사용할 때pytesseract를 설치하는 것 이외에tesseract 플러그인과 대응하는 언어 패키지를 설치해야 한다.다른 호출 인터페이스는pytesseract입니다.image_to_string (image), string 형식의 결과를 되돌려줍니다.python 구현 방법은 다음과 같습니다.
tessdata_dir_config = '--tessdata-dir "D:\Program Files\Tesseract-OCR\\tessdata\" ' \
'--psm 6'
pytesseract.pytesseract.tesseract_cmd = 'D:\Program Files\Tesseract-OCR\\tesseract.exe'
card_no = pytesseract.image_to_string(image, lang="chi_sim", config=tessdata_dir_config)
여기서 반환된 카드no는tesseract 검사 결과입니다.
3. 정확도 향상:tesseract는 배경이 비교적 빠르고 깨끗하며 문자와 배경이 비교적 뚜렷한 문자, 예를 들어 흰 바탕에 검은 글자나 검은 바탕에 흰 글자를 식별한다.그림을 입력할 때 내부 시스템도 그림을 이치화 처리하지만 처리 방식이 비교적 통일되어 있다고 할 수 없다.따라서 예를 들어 정확도를 높이면 그림을 입력하기 전에 먼저 그림을 이치화 처리할 수 있다.처음 이외에도 재단하는 방식으로 그림 속의 문자를 재단할 수 있어 배경의 방해를 더욱 제거할 수 있다.
4. EAST모델을 이용하여 문자를 검측하고 검측된 문자를 재단한 다음에 재단된 그림을 이치화하여tesseract를 사용하여 검측할 수 있다. 이 방법의 장점은 문자를 포함하는 구역이 작고 이치화 처리에 편리하다는 것이다.
이 내용에 흥미가 있습니까?
현재 기사가 여러분의 문제를 해결하지 못하는 경우 AI 엔진은 머신러닝 분석(스마트 모델이 방금 만들어져 부정확한 경우가 있을 수 있음)을 통해 가장 유사한 기사를 추천합니다:
SPRESENSE x Neural Network Console을 만져 보자 제1회 ~SPRESENS의 소개와 전체의 구성~이 기사는 20일째 기사입니다. 전회는 Katsuaki Takagi씨의 「 」이었습니다. Sony가 발매한 보드 「SPRESENSE」와 「Neural Network Console」을 맞추어 사용해 봅니다. 연재 기사...
텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
CC BY-SA 2.5, CC BY-SA 3.0 및 CC BY-SA 4.0에 따라 라이센스가 부여됩니다.