#PowerAutomate Desktop의 OCR 작업을 시도했습니다.
Power Automate Desktop이란?
로우 코드 개발 플랫폼의 Power Platform 중 자동화를 담당하는 Power Automate이지만 API가 없는 기존 데스크톱 애플리케이션이나 웹 서비스 등도 클라우드 연계하고 싶은 요구에 부응하기 위해 RPA 기능으로 추가된 것이 , Power Automate Desktop입니다.
이러한 방식으로 애플리케이션 작업을 지정하고 클라우드 서비스인 Power Automate에서 호출하여 실행 결과를 얻어 기존 애플리케이션도 쉽게 클라우드 연계를 할 수 있게 되었습니다.
OCR 액션
Power Automate Desktop은 응용 프로그램 대체 작업 외에도 다양한 작업을 제공합니다.
그 중에서 OCR이라는 액션이 있으므로 열어 봅시다.
액션을 보는 한
Tesseract OCR 혹은 MODI OCR 의 엔진을 작성해, 그 엔진을 사용해 텍스트 추출을 실시한다고 하는 흐름과 같습니다.
시험에 간단한 영문 이미지를 사용하여 추출해 봅시다.
Tesseract OCR
우선 영어 위키피디아의 톱 페이지에 있는 이 이미지를 Tesseract OCR을 사용하여 불러옵니다.
각 액션의 설정값은 이런 느낌
실행 한 결과는 ... 잘 잡혀 있습니다!
MODI OCR
이번에는 MODI OCR 엔진을 사용해 보겠습니다.
MODI OCR의 엔진 설정은 이런 느낌입니다.
실행해 보면 ...
아마, 런타임 오류 ...
원래 MODI OCR은 무엇입니까?
MODI란 Microsoft Office Document Imaging이라는 기능이라고 하며, Office 2007까지는 표준으로 들어 있던 기능인 것 같습니다.
Wikipedia의 정보라고 여기
출처: Wikipedia Microsoft Office 도구
우선 Office 2007을 설치한 후 다시 시도해 보면 문제 없이 추출할 수 있었습니다.
SharePoint Designer 2007에도 포함된 것 같습니다.
...하지만 이미 지원 종료에 대해 배포되지 않았습니다.
MSDN Library에서 다운로드하는 것은 현재 가능하므로, 계약되어 있는 분은 이쪽으로부터 다운로드합시다.
일본어 텍스트 추출
MODI의 경우는 일본어도 표준으로 추출할 수 있는 것 같습니다.
그래서 이번에는 일본어 Wikipedia의 이쪽을 읽어 보겠습니다.
MODI OCR
Tesseract OCR
표준이라고 일본어가 들어 있지 않습니다.
다른 언어 사용을 활성화하면 언어 데이터를 묻습니다.
언어 데이터는 Tesseract github 페이지의 설치 프로그램에 포함되어 있는 것 같습니다.
GitHub - Tesseract at UB Mannheim
위의 링크에서 설치 프로그램을 다운로드하여 설치해 봅시다.
설치하는 동안이 Additional language data
를 체크하는 것을 잊지 마십시오.
설치가 완료되면 언어 데이터 경로에 설치할 폴더의 tessdata
를 지정합니다.
또한 언어 약어로 jpn
를 지정합니다.
그럼 시도해 봅시다.
요약
Power Automate Desktop에서 OCR 작업을 사용하는 방법을 요약했습니다.
실제로는, 이미지 파일뿐만 아니라, 화면 전체나, 액티브 윈도우의 화면도 OCR의 대상으로 할 수 있거나와, 꽤 폭넓은 설정을 할 수 있는 것 같기 때문에, 여러분도 꼭 여러가지 시험해 보세요!
Reference
이 문제에 관하여(#PowerAutomate Desktop의 OCR 작업을 시도했습니다.), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다
https://qiita.com/rnakamuramartiny/items/ee707f5981d29792df96
텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념
(Collection and Share based on the CC Protocol.)
Power Automate Desktop은 응용 프로그램 대체 작업 외에도 다양한 작업을 제공합니다.
그 중에서 OCR이라는 액션이 있으므로 열어 봅시다.
액션을 보는 한
Tesseract OCR 혹은 MODI OCR 의 엔진을 작성해, 그 엔진을 사용해 텍스트 추출을 실시한다고 하는 흐름과 같습니다.
시험에 간단한 영문 이미지를 사용하여 추출해 봅시다.
Tesseract OCR
우선 영어 위키피디아의 톱 페이지에 있는 이 이미지를 Tesseract OCR을 사용하여 불러옵니다.
각 액션의 설정값은 이런 느낌
실행 한 결과는 ... 잘 잡혀 있습니다!
MODI OCR
이번에는 MODI OCR 엔진을 사용해 보겠습니다.
MODI OCR의 엔진 설정은 이런 느낌입니다.
실행해 보면 ...
아마, 런타임 오류 ...
원래 MODI OCR은 무엇입니까?
MODI란 Microsoft Office Document Imaging이라는 기능이라고 하며, Office 2007까지는 표준으로 들어 있던 기능인 것 같습니다.
Wikipedia의 정보라고 여기
출처: Wikipedia Microsoft Office 도구
우선 Office 2007을 설치한 후 다시 시도해 보면 문제 없이 추출할 수 있었습니다.
SharePoint Designer 2007에도 포함된 것 같습니다.
...하지만 이미 지원 종료에 대해 배포되지 않았습니다.
MSDN Library에서 다운로드하는 것은 현재 가능하므로, 계약되어 있는 분은 이쪽으로부터 다운로드합시다.
일본어 텍스트 추출
MODI의 경우는 일본어도 표준으로 추출할 수 있는 것 같습니다.
그래서 이번에는 일본어 Wikipedia의 이쪽을 읽어 보겠습니다.
MODI OCR
Tesseract OCR
표준이라고 일본어가 들어 있지 않습니다.
다른 언어 사용을 활성화하면 언어 데이터를 묻습니다.
언어 데이터는 Tesseract github 페이지의 설치 프로그램에 포함되어 있는 것 같습니다.
GitHub - Tesseract at UB Mannheim
위의 링크에서 설치 프로그램을 다운로드하여 설치해 봅시다.
설치하는 동안이
Additional language data
를 체크하는 것을 잊지 마십시오.설치가 완료되면 언어 데이터 경로에 설치할 폴더의
tessdata
를 지정합니다.또한 언어 약어로
jpn
를 지정합니다.그럼 시도해 봅시다.
요약
Power Automate Desktop에서 OCR 작업을 사용하는 방법을 요약했습니다.
실제로는, 이미지 파일뿐만 아니라, 화면 전체나, 액티브 윈도우의 화면도 OCR의 대상으로 할 수 있거나와, 꽤 폭넓은 설정을 할 수 있는 것 같기 때문에, 여러분도 꼭 여러가지 시험해 보세요!
Reference
이 문제에 관하여(#PowerAutomate Desktop의 OCR 작업을 시도했습니다.), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다
https://qiita.com/rnakamuramartiny/items/ee707f5981d29792df96
텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념
(Collection and Share based on the CC Protocol.)
Reference
이 문제에 관하여(#PowerAutomate Desktop의 OCR 작업을 시도했습니다.), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다 https://qiita.com/rnakamuramartiny/items/ee707f5981d29792df96텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념 (Collection and Share based on the CC Protocol.)