Google Cloud Vision API를 사용해 보았습니다.

Google Cloud Vision이란?



Google Cloud Vision은 Google에서 제공하지만 제공하는 이미지 분석 서비스입니다.
이번에는 이미지의 문장을 읽는 데 사용해 보았습니다.

절차 1 Google Cloud Platform에 등록하기



아래 링크에서 Google Cloud Platform에 가입하세요.
또한 등록에는 신용카드가 필요합니다.
htps : // 이런. cぉd. 오, ぇ. 이 m / 껄껄 g-s r d? hl = 그럼

Cloud Vision API 사용



화면 상단의 검색창에 Cloud Vision API를 입력합니다.


전환 후 화면에서 Cloud Vision API를 활성화하면 완료됩니다.


서비스 계정 만들기



서비스 계정이란?
여기에서 인용 → h tps : // c ぉ d. 오, ぇ. 코 m/아 m/도 cs/세 rゔぃ세 아코응 ts? hl = 그럼

서비스 계정은 사용자가 아닌 애플리케이션 및 가상 머신(VM) 인스턴스에서 사용되는 특수 계정입니다. 애플리케이션은 서비스 계정을 사용하여 승인된 API 호출을 수행합니다.

이제 서비스 계정을 만들어 봅시다.
IAM 및 관리에서 서비스 계정을 클릭합니다.


전환 후 화면에서 "서비스 계정 만들기"를 클릭합니다.


적절한 서비스 계정 이름을 입력하고 만들기를 클릭하십시오.


계속을 클릭


마침을 클릭


이어서 인증을 위한 비밀키의 작성입니다. 상기의 조작을 실시한 후, 이하와 같은 화면이 되어 있다고 생각하므로 「조작」을 클릭해 키의 작성을 실시합니다


대화 상자가 표시되므로 JSON을 선택하여 키를 만듭니다.
키는 임의의 폴더에 배치하고, 후술하는 환경 변수(GOOGLE_APPLICATION_CREDENTIALS)에 키의 패스를 지정해 주세요.


gem을 설치.
gem 'google-cloud-vision'

개인 키의 경로를 환경 변수로 설정하여 준비가 완료됩니다.
export GOOGLE_APPLICATION_CREDENTIALS="/hoge/fuga.json"

구현



공식 문서를 참고로 하여 다음과 같이 되었습니다.
· 공식 문서
htps : // c ぉ d. 오, ぇ. 코 m/ゔぃ시온/도 cs/ぃb 라리에 s? hl = 그럼 # c ぃ

공식 예제와 가장 다른 점은 label_detection 대신 text_detection을 사용한다는 것입니다.
label_detection을 사용하면 이미지에 어떤 것이 포함되어 있는지 감지할 수 있습니다.
예를 들면, 역내를 찍은 사진이라면 개찰구나 선로, 발매기 등의 물건이 검출되는 것입니다.
이번에는 이미지에서 문자를 감지하고 싶었기 때문에 text_detection을 사용했습니다.
@image = Image.new

require "google/cloud/vision"
image_annotator = Google::Cloud::Vision.image_annotator

# 読み込む画像を指定
file_name = "~/hoge.jpg"

# file_nameを引数にしてCloud Visionで解析する
response = image_annotator.text_detection image: file_name

response.responses.each do |res|
  @image.OCR = res.text_annotations[0].description
end

요약



Google Cloud Vision API는 이 예제 외에도 PDF 파일 분석, 이미지 내 얼굴 감지 등에도 사용할 수 있습니다.
한달에 1000건의 로드까지는 무료로 실시할 수 있으므로, 여러가지 시험해 자작 어플리에 짜넣어 봅시다!

좋은 웹페이지 즐겨찾기