Azure 컴퓨터 비전 - 소개
4105 단어 azure
What is cognitive service?
Cognitive Services는 Microsoft가 인공 지능(AI) 분야의 문제를 해결하기 위해 개발한 일련의 기계 학습 알고리즘입니다. 인지 서비스의 중요성은 사전 훈련된 모델을 사용하여 이미지를 분석한다는 것입니다.
인지 서비스에는 다음과 같은 일련의 서비스가 있습니다.
What is computer vision?
Azure의 Computer Vision 서비스는 관심 있는 시각적 기능을 기반으로 이미지를 처리하고 정보를 반환하는 고급 알고리즘에 대한 액세스를 제공합니다. 이미지의 픽셀 값은 기계 학습 모델을 교육하고 예측.
컴퓨터 비전 서비스를 이용하는 방법은 크게 3단계로 나뉩니다.
01단계 - 리소스 생성
Microfot Azure Portal에서 리소스를 생성하기 전에 Azure 구독이 있어야 합니다.
기본적으로 두 가지(02) 유형의 리소스가 있습니다.
하나의 인지 서비스(이미지 분석 전용)만 사용하는 경우 컴퓨터 비전 리소스를 사용할 수 있습니다.
둘 이상의 Cognitive Service를 사용하는 경우 Cognitive Service 리소스를 사용할 수 있습니다.
02단계 - 키 및 엔드포인트 가져오기
기본 설정에 따라 관련 리소스 유형을 선택한 후 계정에서 해당 리소스를 생성할 수 있습니다.
리소스 관리 섹션에서 서비스를 구현하는 데 사용 중인 코드로 키와 엔드포인트를 복사할 수 있습니다.
키는 클라이언트 애플리케이션을 인증하는 데 사용됩니다.
endpoint는 리소스에 액세스할 수 있는 HTTP 주소를 제공합니다.
03단계 - 이미지 제출
컴퓨터 비전 서비스로 텍스트 읽기
이전 항목에서 설명한 것처럼 컴퓨터 비전 또는 인지 서비스 리소스를 사용하여 프로세스를 수행할 수 있습니다.
텍스트를 읽는 과정에서 OCR(Optimal Character Recognition)이라는 단어를 주로 사용합니다.
What is OCR?
OCR은 인쇄된 이미지 처리의 기본 기반입니다. 이 기술은 메모를 작성하고 양식을 디지털화하고 인쇄 또는 손으로 쓴 수표를 스캔하는 데 사용됩니다.
컴퓨터 비전 서비스는 이미지에서 텍스트를 읽는 데 사용할 수 있는 두(02) API를 제공합니다.
OCR API는 이미지에서 소량의 텍스트를 추출합니다. 다양한 언어로 된 텍스트를 인식할 수 있습니다. 이 API는 이미지를 처리하기 위한 정보의 계층 구조를 반환합니다. 계층 구조는 다음과 같습니다.
Region
Lines
words
각 요소에 대해 OCR API는 텍스트의 윤곽선과 유사한 경계 상자 좌표도 반환합니다. 영역, 선 및 단어가 나타나는 이미지의 위치를 나타내는 사각형을 정의합니다.
읽기 API는 텍스트가 많은 스캔 문서와 손으로 쓴 이미지와 인쇄된 이미지 모두에서 텍스트를 추출하는 데 더 나은 옵션입니다.
Read API를 사용하는 프로세스는 크게 3가지가 있습니다.
01단계 - 이미지를 API에 제출하고 응답으로 작업 ID 검색
02 단계 - 작업 ID를 사용하여 이미지 분석 연산자의 상태를 확인하고 완료될 때까지 기다립니다.
03 단계 - 작업 결과를 검색합니다.
Read API는 또한 이미지를 처리하기 위한 정보의 계층 구조를 반환합니다.
Pages
Lines
words
필기 이미지와 인쇄된 이미지에서 텍스트를 추출하는 방법은 무엇입니까?
이 기사 시리즈의 02부에서 계속됩니다... 😉
Reference
이 문제에 관하여(Azure 컴퓨터 비전 - 소개), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다 https://dev.to/nishiki97/azure-computer-vision-introduction-34l0텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념 (Collection and Share based on the CC Protocol.)