JavaScript에서 현실 세계의 문자를 읽는 방법을 살펴 보았습니다.

기계 학습의 ml5.js에 대해 배웠기 때문에 무언가를 만들려고 생각하고, 보통의 온도계의 디지털 표시한 숫자를로 읽는 것을 만들려고 생각했습니다.



ml5.js가 지원하는 모델에서 찾기



우선 갓 배운 ml5.js에서 찾아 보겠습니다만… 'OCR', 'character', 'number'로 검색했지만 찾을 수 없습니다. 카메라에 비친 문자를 읽는 기능은 수요적으로도 메이저 커녕이라고 생각하고 있었습니다만…

Teachable Machine에서 각각의 체온의 사진을 찍어 학습시키면 된다고는 생각합니다만 수고가 너무 걸려 본말 전도이고, 무엇보다 노린 체온으로 할 수 있으면 너는 인간이 아니다.

Google 교사에게 물어보기



다음 사이트에 잘 정리되어 도움이되었습니다. 그래서 알게 된 라이브러리에 대해 구현 기사 등을 더 조사해 나갑니다.

tesseract.js



데모용 사이트를 보는 느낌 좀처럼 텐션 오르는 느낌입니다.
"Tesseract.js can run either in a browser and on a server with NodeJS."

덧붙여서 「사람이 쓴 문자를 인식하고 싶을 때는 OCR이 아니라 필기 인식(Hand written recognition)이라고 부른다」라는 지견을 얻었습니다. ···디지털 표시된 숫자를 읽고 싶은 경우는?


tessedit_char_whitelist로 읽을 문자열을 화이트리스트로 지정할 수 있습니다.

자주 캔커피에 대해서는, 숫자 10자리 정도를 손입력하는 것이 귀찮아서 자동화해 보았다, 라고 하는 실장예입니다. 이것은 나도 번거롭고 결국 응모하지 않기 때문에 멋집니다.
문자열 화이트리스트에 숫자를 각각 넣으면 인식 정밀도 올라갈까.


Tesseract의 대응 형식은 넓고, Canvas 요소를 그대로 투입 가능한 것도 편리한 곳입니다.

여러가지 시험되고 있습니다. 이번 샘플 코드에 사용하겠습니다. (- -) (_ _) 페콜리





ocrad.js



MyScript



유료.

요약



평판과 구현 예제의 정보량에서 tesseract.js를 사용해 봅시다.

좋은 웹페이지 즐겨찾기