Google Cloud Vision은 굉장합니다.

5343 단어 CloudVisionAPI gcp 이미지 인식

이미지 인식을 제공하는 API를 찾고 있다면 생각했던 것보다 Cloud Vision API

제1문

우선 시작에 이것이죠?

간단하네요. 튜브 와사비입니다. 그건 그렇고, 나는 국수가 와사비입니다.

이제 이 이미지를 Cloud Vision API로 분류해 보겠습니다.

API만 사용하면 여기에서 시도해 볼 수 있습니다.
구현의 필요도 없고 웹상의 서비스로서 사용할 수 있으므로 우선은 이것이 추천입니다.

음, 궁금한 결과는

Highlighter 0.8138
Office Supplies 0.583
Pen 0.5529
Permanent marker 0.5331
Casey Japanese Momen-tofu Sticky Small size(japan Import) 0.3519
Fluorescence 0.2985
Marker pen 0.2944
Product 0.2887
Sakura Color Products Corporation 0.2816
Eraser 0.2728
Zebra 0.2519
Gift 0.2331
Color 0.2238

Highlighter 0.8138 에서 형광펜이 톱이라는 결과가 되었습니다 www
버그가 있습니다 www

그래서 정답을 살펴 보겠습니다.

슈고이
과연 Google

속은 사람은 いいね 버튼을 누르십시오.

두 번째 질문

제 1 질문으로 어쩐지 분위기 알았다고 생각합니다만 이어서 2 질문입니다

이게 뭐야?

Post-it Note　1.0614
Casey Japanese Momen-tofu Sticky Small size(japan Import)　0.7351
Office Supplies　0.5435
Paper　0.4638
Tofu　0.4041
ジオデザイン 付箋 板付かみぼこ 白 KFWT-01　0.3624
Notebook　0.3257
Memo　0.3207
Food　0.3035
ビバリー 付箋 よりどりふせん トイストーリー FS-003　0.29
Bị vong lục　0.2858

Post-it Note　1.0614 그렇다고 하는 것으로 스티커 메모라고 말하고 있습니다만, 어떻습니까?

멋지다.

확실히 말해 인간이라도 확실히 모르겠습니다만 어떻게 되어 있습니까?

메커니즘

미스리드적인 쓰는 방법을 해 버렸습니다만, 이것은 통상의 화상 인식이 아니고 WebDetection 라고 하는 기능을 사용하고 있습니다.
내부는 전혀 모르기 때문에 구조라고 말할 수 있는 수준은 아닙니다만, 사용하고 있는 것은 Google의 화상 검색의 기능인 것 같습니다.
이미지에서 읽을 수 있는 정보를 취득하고 있는 것이 아니라, Web상으로부터 화상 검색으로 일치한 정보를 바탕으로 하고 있기 때문에, 외형에서는 알기 어려운 화상에서도 정확하게 정보를 취득할 수 있었던 것이군요.

그물에있는 이미지를 분류하고 싶다는 용도로 최강은?
과연 Google

주의점

놀라운 기능이지만주의 사항도 있습니다.

이용금액

이 기능은 이용 요금이 상당히 높습니다.
자세한 것은 Vision API 요금 를 참고로 해 주셨으면 합니다만

라벨 검출(이른바 통상의 화상 인식)은 $1.50 / 1000枚 라고 하는 금액입니다만, 이 WebDetection 의 기능은 $3.5 / 1000枚그래도 굉장한데 변함없지만

거기까지 많은 이미지를 취급하지 않는다고 하는 것이라면, 한 달에 1000장까지는 무료 테두리가 있으므로, 거기에 맞는다면 무료로 사용할 수 있습니다.

스스로 찍은 사진에는 효과가 얇다.

당연합니다만, 화상 검색을 하고 일치하는 화상을 찾아내는 것으로 고정밀도의 정보를 찍고 있으므로, 스스로 찍은 사진에 대해서 가도 지금까지의 효과는 얻을 수 없습니다.
자신이 만든 재료 상품을 올바르게 분류하는 것은 우선 무리입니다.

다만, 상품 화상을 스마트폰으로 찍어 API에 넣으면, 제대로 인식해 주었습니다.

Amazon의 상품 페이지를 비친 디스플레이를 스마트 폰으로 촬영하여 API에 걸린다는 쓸데없는 일을 해 보았습니다만, 제대로 Post-it Note 라고 인식하고 있습니다. 어두워지거나 화질이 떨어졌을지라도 역시 슈고

Post-it Note 1.092
Casey Japanese Momen-tofu Sticky Small size(japan Import) 0.7109
Office Supplies 0.7027
便条 0.6509
Paper 0.5991
Tofu 0.4988
Product 0.4453
ジオデザイン 付箋 板付かみぼこ 白 KFWT-01 0.3963

gcloud 명령으로 실행

프로그램적으로 사용하는 경우에서 가장 쉬운 것은 gcloud 커맨드일까? 라고 생각하므로 그 명령도 기재해 둡니다

도움말에 따르면 다음 명령입니다.

gcloud ml vision detect-web IMAGE_PATH

IMAGE_PATH에 대해

     IMAGE_PATH
        Path to the image to be analyzed. This can be either a local path or a
        URL. If you provide a local file, the contents will be sent directly to
        Google Cloud Vision. If you provide a URL, it must be in Google Cloud
        Storage format (gs://bucket/object) or an HTTP URL (http://... or
        https://...)

그렇기 때문에, 여러 가지가있는 것 같습니다.

gcloud ml vision detect-web ./image.png # ローカルの画像ファイルもいける
gcloud ml vision detect-web http://*****.com/image.png # URLもいける
gcloud ml vision detect-web gs://bucket/object # Cloud Storage上のオブジェクトもいける

진지하게 사용하면 통합하는 형태가되지만 튜토리얼이 준비되어있었습니다
파이썬으로 할 때 자습서는 아래를 참조하십시오.
웹 검색 자습서 | Cloud Vision API 문서 | Google Cloud

참고

Vision AI | ML에서 이미지 정보 가져오기 | Cloud Vision API | Google Cloud

Reference

이 문제에 관하여(Google Cloud Vision은 굉장합니다.), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다 https://qiita.com/dbgso/items/3b0b232e3d17fe4e10db

텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.

우수한 개발자 콘텐츠 발견에 전념 (Collection and Share based on the CC Protocol.)

AzureCustomVisionService에서 "염 얼굴, 소스 얼굴을 결정"해 보았습니다.

자체 제작 얼굴 감지 API를 작성하고 IBM Cloud에 게시

좋은 웹페이지 즐겨찾기

개발자 우수 사이트 수집

개발자가 알아야 할 필수 사이트 100선 추천 우리는 당신을 위해 100개의 자주 사용하는 개발자 학습 사이트를 정리했습니다