Outsystems의 Google Cloud Vision OCR을 사용해 보았습니다.

소개



어느 날 프로젝트에서 OCR 기술 검증을 했습니다.
평소와 같이, 별로 문서 없구나-라고 생각했으므로 여기에 적습니다.

내용은 Google Cloud Vision OCR을 사용하는 간단한 방법입니다.
기존 DEMO 앱이 기본입니다.

가정 독자



Outsystems에서 OCR을 사용하고 있다고 생각하는 사람
Google Vision API는 어떻습니까? 라고 생각하는 분

사전 준비



■Forge에서 아래 모듈을 DL
htps //w w. 오, tsys ms. 코 m / 후 r 게 / 코 m 포넨 t - ゔ ぇ r

※덧붙여서 DL하지 않아도, 「Try Now」버튼을 누르는 것으로 WEB상에서 OCR의 검증은 할 수 있게 되어 있습니다.

■ Google Vision API의 API 키 획득

여기에 자세히 정리했습니다.
Google Cloud Vision API에서 문자 인식 시도

할 수 있는 일



Google Vision API에는 다양한 OCR 기능이 있지만 이 Forge는 문자 식별만 지원합니다.


이번에는 문자 인식 중에서도 아래 두 가지를 사용해 보았습니다.
※기본값은 'TEXT_DETECTION'이었습니다.



그 외의 기능은 이쪽을 확인해 주세요.
h tps : // c ぉ d. 오, ぇ. 코m/ゔぃ시온/p리신g? hl = 그럼

①DEMO의 화면을 선택





②사전에 준비한 API 키를 세트





③Process 버튼을 눌러 결과를 취득



글쎄, 거기서 얻을 수있다 : D


④ DOCUMENT_TEXT_DETECTION으로 변경하여 테스트





helper.cs의 type을 'TEXT_DETECTION'을 'DOCUMENT_TEXT_DETECTION'으로 수정하여 Publish.
var feature = new Feature { Type = "DOCUMENT_TEXT_DETECTION" };

····· 그러나 결과는 TEXT_DETECTION과 변함없이


면허서의 사진이라든지 해 보면 약간 차이가있었습니다.

⑥ 상기의 취득한 값을 폼 등에 자동으로 세트하고 싶은 경우



반환값은 TEXT형으로 돌려주고 있었습니다.



DEMO 앱을 보면, Extension측의 「GetDateAndAmountRegex」액션으로 고리고리↑의 반환값을 트림하고 있었습니다.
그래서, 그 트림한 값을 화면상에서 세트 하는 흐름이 됩니다.
※Outsystems측에서 트림해도 된다고는 생각합니다만.

나는 지금부터 "GetDateAndAmountRegex"액션을 참고하여 트림 처리를 확장해 나갈 것입니다.

끝에



Google Cloud Vision API의 다른 기능도 Forge에서 지원하고 싶습니다 (절실)
정확성은 생각했을 정도는 아니었지만 사용에 따라 사용할 수있는 수준입니다.

좋은 웹페이지 즐겨찾기