Cloud Vision API의 텍스트 감지

Cloud Vision API에 대한 텍스트 감지 API를 시도했습니다.
여러 언어의 프로그램 라이브러리가 공식에서 나오지만
이번엔 루비 물건으로 해봤어요.

차리다


• Google Cloud Platform을 통한 프로젝트 작성


Google Cloud Vision API의 빠른 시작
최선을 다하다.
이렇게 하면 API에서 사용되는 항목 ID를 얻을 수 있습니다.

실행


정부측의거리 2

설치gem


젬이 있어서 설치.
(이것은 텍스트 검색뿐만 아니라 다른 cloud-vision API도 함께 사용할 수 있음)
gem install google-cloud-vision

실행


준비된 곳에서 얻은 프로젝트 ID를 가져오고 실행합니다.
# project_id = "Your Google Cloud project ID"
# image_path = "Path to local image file, eg. './image.png'"

require "google/cloud/vision"

vision = Google::Cloud::Vision.new project: project_id
image  = vision.image image_path

puts image.text

여러 가지 그림을 써보도록 하겠습니다.


• 매우 알기 쉬운 이미지


Text detection samples

결실

image.text
=> #<Text text: "あいうえお\nABC\n", locale: "ja", bounds: 4, words: 2, pages: 1>
완벽한 거예요.

• 글자를 조금 더럽히다



결실

=> #<Text text: "あい うえお\nAB\n", locale: "ja", bounds: 4, words: 3, pages: 1>
나는 미묘하게 이해할 수 없다.소음의 색깔과 문자가 다른데, 문자에 대한 소음률은?성적인 게 많으면 안 되는 분위기.

• 글자를 더럽히다


결실


image.text
=> nil
전혀 인식이 안 돼요.
글의 색깔이 완전히 달라서 잘 표현될 것 같지만 달콤하다.

회전 문자 1



결실

image.text
=> #<Text text: "あいうえお\n", locale: "ja", bounds: 4, words: 1, pages: 1>
회전한 후의'사랑 o'를 깨달았지만 회전하지 않은'ABC'는 식별되지 않았다(words도 2->1)

회전 문자 2



결실

image.text
=> #<Text text: "あいうえお\n", locale: "ja", bounds: 4, words: 1, pages: 1>
문자 회전 1의 결과는 같습니다.
회전한 후의'o를 사랑한다'는 것을 깨달았지만, 회전하지 않은'ABC'는 인식되지 않았다.
이거, 그림에 있는 글자가 다 똑같아요. (똑같아요?)아니, 각도는 안돼?

회전 문자 3



결실

image.text
=> #<Text text: "ABC\nあいうえお\n", locale: "ja", bounds: 4, words: 2, pages: 1>

동일한 각도의 회전이면 OK입니다.ABC의 식별이 먼저 도착했기 때문에 아마도 이미지를 상반된 것으로 처음부터 검출되었을 것이다

회전 문자 4



결실

image.text
=> #<Text text: "ABC\nあいうえお\n", locale: "ja", bounds: 4, words: 2, pages: 1>

이 각도 회전까지 OK인 것 같아요.

회전 문자 5



결실

image.text
=> #<Text text: "あいうえお\n", locale: "ja", bounds: 4, words: 1, pages: 1>

이 각도 안 돼.

감상


공식gem이 있는데 도입 전의 문턱은 높지만 각도와 소음 때문에 식별이 불가능하기 때문에 이미지를 어떻게 읽는지 고려해야 한다.

좋은 웹페이지 즐겨찾기