【kintone x OCR】~정규 표현 검색편~ kintone의 OCR 플러그인을 개발하는 ④【GCP】

최종 목표



kintone상에서 이↓이미지(청구서)를 OCR 처리해, 청구 번호・지불 기한・송금처・청구처・품목(품명・수량・・・의 테이블 부분)의 값을 취득하는 것을 최종 목표로 합니다 .


덧붙여 설명은 나중에 「우선 시험하고 싶다」라고 하는 분은, 플러그인(템플릿) 다운로드 로부터 kintone용의 플러그 인과 템플릿을 시험용(1개월간) 받을 수 있습니다.

이번(정규 표현 검색편)의 목표



전회(③)에서 향후의 과제로 한, 근접한 값을 취득하기 위해서, 정규 표현을 이용한 값의 취득을 실시하고 싶습니다. *여기↓로부터 「수량」과 「단위」의 값을 잘 취득하고 싶습니다.

정규식 세부 사항 : htps : // 그럼.ぃきぺぢ아. 오 rg / 우키 / % 6 % 오 D % 오 3 % 오 8 % 오 6 % 8F % 오 8 % 오 1 % 오 8 % 오 7 % 8F %

구체적인 취득 방법



이 문서에서는 수량 열에 숫자만(이번이면 1,3,5)만 표시됩니다. 반대로 단위의 열에는 숫자 이외 밖에 기재되지 않습니다. 이와 같이 대상 캐릭터 라인의 패턴을 이용해 값을 취득하는 방법을 정규 표현 검색이라고 정의합니다.

KEYWORD 검색 + ZONE 검색에서 얻은 값 중에서 미리 정한 "정규 표현식"과 일치하지 않는 값은 대상에서 제외합니다. 구체적으로는 「수량」은 숫자만이므로 정규 표현에 따라 [0-9]로 하고, 「단위」열은 정규 표현에 따라 [^0-9]로 정합니다.
//seiki→[0-9]や[^0-9]
//seiki.test()で正規表現(seiki)に合致しているか判定
let seiki;
for(let i = 0; i < list.length; i++){
   if(seiki && seiki.test(list[i].String)){
      result.push(list[i]);
   }
}

그렇게 함으로써 「수량」열과 「단위」열의 값을 잘 취득(분리) 할 수 있었습니다.

kintone 계정이 없는 분



아래에서 이메일 주소 등록만으로 이용하실 수 있습니다.
OCR 시스템 사용자 등록 : htps : // 이 m / ぁ s와 쥐 / ms / 65b9102c868 09b3248 에

kintone 계정을 가지고 있는 분



플러그인(템플릿) 다운로드



여기까지의 설명 및 이후의 기사 내용도 망라한 kintone용 OCR 플러그인 및 템플릿이 아래에서 다운로드(무상으로 구입) 가능합니다.

이용 방법 : h tps:// 퀵했다. 작은 m/아스와 소리 보고/있어 MS/C40cd8543f14496c0C4

*IE에서는 이용하실 수 없습니다(Chrome, edge는 동작 확인 완료, 그 외 브라우저는 미확인입니다)
*첫회 이용시부터 1개월간 무상으로 이용하실 수 있습니다.
*이용에 있어서, 이용자의 도메인 정보를 취득합니다(도메인마다 이용 기간을 관리하고 있습니다).
*이용시 별도 Google Cloud Vision의 API 키를 취득해야 합니다. (취득 대행도 실시하고 있습니다)
Cloud Vision 세부정보: h tps : // c ぉ d. 오, ぇ. 코 m/ゔぃ시온/도 cs? hl = 그럼
* 이용 시 Cloud Vision 이용 요금이 발생할 수 있습니다. (2020/12/24 현재 월간 1000 유닛까지 무료로 이용 가능합니다.)
Cloud Vision API 요금: htps : // c ぉ d. 오, ぇ. 코m/ゔぃ시온/p리신g? hl = 그럼
API 키 획득 방법 : h tps : // 타노시마네. s 취해 s. jp/네ws/602220196728베15433783에4
API 키의 관리에는 충분히 주의해 주세요(자기 책임으로 부탁합니다)

미래의 도전



'단가' 열의 결과를 보면 5 행에서 실제로 100이 정확하지만 10D (마지막이 알파벳 D)입니다. *실은 원문서도 10D입니다만, 100을 10D라고 인식 차이했다고 가정해 주세요.

이 경우, 「정규 표현 검색」으로 숫자만으로 지정해 버리면(자), 캐릭터 라인 자체를 제외해 버려, 값을 로스트합니다. 따라서 다음 번에는 문자 단위로 인식 차이에 대한 대책을 기재하고 싶습니다.

지금까지 할 수있는 일




* KEYWORD 검색 (청구 번호 · 지불 기한 · 송금처), ZONE 검색 (청구 원) 이외에 정규 표현 검색을 보완하여 명세서 (수량 · 단위 · 금액)까지 취득 할 수있었습니다.

관련 기사



kintone OCR 플러그인 Vision API arr.by LOM 사용 방법
kintone OCR 플러그인 문서 템플릿을 만드는 방법
킨톤 OCR 플러그인 개발 ①
킨톤 OCR 플러그인 개발 ②
킨톤 OCR 플러그인 개발 ③

좋은 웹페이지 즐겨찾기