Tesseract 트레이닝 라이브러리 연구 과정 중의 문제점과 해결 방안

tess 라이브러리 버전 3.05 시스템 win10 64비트 문제 1: 인터넷의 일부 일괄 처리 코드에 따라 라이브러리를 통합하는 단계에서 이상한 오류가 계속 발생했습니다. 다음과 같습니다.
Error: Unable to open ECHO!
"Fatal error encountered!" == NULL:Error:Assert failed:in file ../../../../ccutil/globaloc.cpp, line 75

다음과 같이 글꼴 병합이 불완전하게 됩니다.
TessdataManager combined tesseract data files.
Offset for type  0 (xx\my.config                ) is -1
Offset for type  1 (xx\my.unicharset            ) is 140
Offset for type  2 (xx\my.unicharambigs         ) is -1
Offset for type  3 (xx\my.inttemp               ) is -1
Offset for type  4 (xx\my.pffmtable             ) is -1
Offset for type  5 (xx\my.normproto             ) is -1
Offset for type  6 (xx\my.punc-dawg             ) is -1
Offset for type  7 (xx\my.word-dawg             ) is -1
Offset for type  8 (xx\my.number-dawg           ) is -1
Offset for type  9 (xx\my.freq-dawg             ) is -1
Offset for type 10 (xx\my.fixed-length-dawgs    ) is -1
Offset for type 11 (xx\my.cube-unicharset       ) is -1
Offset for type 12 (xxk\my.cube-word-dawg        ) is -1
Offset for type 13 (xx\my.shapetable            ) is -1
Offset for type 14 (xx\my.bigram-dawg           ) is -1
Offset for type 15 (xx\my.unambig-dawg          ) is -1
Offset for type 16 (xx\my.params-model          ) is -1

정확한 상황은 1, 3, 4, 5, 13행이 -1이 아니면 라이브러리 훈련에 성공해야 한다.
솔루션:https://bbs.csdn.net/topics/390910241이 문장 중yblchinastar의 대답
tesseract [lang].[fontname].exp[number].tif   [lang].[fontname].exp[number] nobatch
 box.train

이 코드의nobatch를 삭제하면 라이브러리가 통합됩니다.
아직nobatch가 삭제된 후 어떤 영향을 미쳤는지, 그 작용이 무엇인지 모르겠습니다. 만약 동료가 알고 있다면 댓글로 알려주시면 감사하겠습니다.
테스트에 따르면 3.05.02버전은 nobath문제가 존재하지 않고 식별이 더욱 정확하여 기존의 대량 코드에 맞게 사용된다.tesseract 3.5.02 마지막 안정적인 버전을 사용하세요.
===============================================================

좋은 웹페이지 즐겨찾기