오늘부터 Amazon Rekognition Custom Labels에서 이동을 배울 수 있습니다!

5061 단어 발레ReKognitionAWS
이것은 기계 학습 도구 by 닛케이xTECH 비즈니스 AI ③ Advent Calendar 2019 발굴의 문장이다.12월 후반에 기사를 쓰고 싶었는데 12월 전반에 기사를 쓰는 사람이 적은 것 같아서 미리 썼어요.이 글은 제가 추천하는 머신러닝 도구로 지난주께 아마존 웹 서비스(AWS)에서 발표한 아마존 Rekognition Custom Labels를 소개합니다.
참조: 닛케이 엑스텍'이미지 인식 AI의 독자 개발은 쉽고, AWS는 새로운 서비스'Rekognition Custom Labels'를 제공한다'
11월 25일에 발표되고 이용 가능한 것은 12월 3일(일본시간 12월 4일)이어서 사용할 수 있다.이렇게 말하면 이 기사의 제목은'오늘부터~'이지만 시도하다 보니 이튿날(일본시간 12월 5일)이 됐다.아직 일본에서는 사용할 수 없기 때문에 버지니아 북부 지역에서 이동을 시도했다.원래 이 기능은 일본어 설정에서 나타나지 않기 때문에 AWS를 영어로 설정할 필요가 있다.

서버에서 이미지 인식 기능을 사용할 수 있는 Rekogniton!


발레로 이미지 인식이 쉬워 이전부터 리코그니션을 좋아했다.
예를 들어 LINE에 이미지 메시지를 보낸 후에 나는 이미지에 나타난 것이 무엇인지 판단할 수 있는 프로그램을 만들어 보았다.다음 그림에서 보듯이 피자 그림을 보내면 Food:94%와 Pizza85%의 결과를 LINE 메시지로 회답합니다.

이런 앱은 리코그니션이 포함된 AWS 서버 발레를 사용하면 의외로 간단하게 제작할 수 있다.무료 버전의 LINE@Messageing API만 준비하면 Webhook URL을 AWS API Gateway로 설정하고 그곳에서 받은 REST 요청을 Lambda로 처리합니다.이미지 데이터가 S3에서 Rekognition으로 해석되면 그 결과를 Lambda에서 LINE Messageing API로 보냅니다.

하지만 예전의 Rekognition에 대한 불만도 있다


이전 Rekognition은 AWS가 준비한 이미지에 맞춰 제작한 머신러닝 모델이었다.따라서 AWS에서 사용하는 학습 데이터의 교사 태그에 없는 내용을 식별할 수 없습니다.해외 공급업체가 제작한 이미지 인식 모델인 만큼 일본인 감각으로는 의외로 느껴지는 것을 인식할 수 없다.예컨대

절대 틀리지 않는 삽벌레의 이미지를 AWS Rekognition으로 분석해도 삽벌레(Stage Beetle)가 먼저 식별되지 않는다는 게 일본인의 느낌이다.일반적으로 분뇨 감로(Dung Beetle)로 여겨진다.US에서는 삽벌레보다 분뇨삿갓이 더 일반적이죠...(그러고 보니 파블 곤충기에도 분뇨삿갓이 언급됐군)...리코그니션에 대한 오랜 불만이다.이런 특징을 지닌 외형이지만 이해하기 쉬운 곤충이다.

리코그니션이 삽벌레를 알게 해주고 싶어!


우선 훈련(공부)!


Amazon Rekognition Custom Labels는 AWS의 새로운 서비스로, 사용자가 자신의 교사 데이터를 소량만 준비하면 독자적인 이미지 인식 AI를 개발할 수 있다.이전 학습을 할 수 있게 된 것이다.이걸 사용하면 삽벌레 이미지 데이터를 몇 장 투입하면 아마존 리코그니션이 삽벌레를 판별할 수 있을 것 같아.
드디어 어제부터 서비스를 이용할 수 있게 돼서 바로 해봤어요.
우선 학습용 이미지 데이터는 구글 검색에서 삽벌레 10개와 갑충 10개를 찾아 준비한다.AWS Rekognition은 버지니아 북부 지역으로, 영어 버전으로 열면 지금까지 없었던 커스텀 레이블스라는 새로운 기능이 있다는 것을 알 수 있다.

Rekognition Custom Labels의 새 프로젝트를 작성합니다.

이미지를 계속 추가합니다.

그리고 라벨과 경계선을 하나하나 설정합니다.(의외로 귀찮아...가슴이 찢어져...)

그럼 학습 데이터가 다 준비되었으니 훈련(기계학습)을 해 보세요!전체 데이터 (20장의 이미지) 중 20%가 검증 데이터입니다.

여기서 기다리면.. 훈련이 끝났습니다.F값은 0.345··· 상당히 낮다.그림 데이터가 너무 적습니까?삽벌레와 딱정벌레는 너무 비슷해서 구별할 수 없나요?등등, 다양한 아이디어가 있었지만 이번엔 시도, 이렇게 진행됐다.

성능 검증



조금만 더 성능을 돌파해 보자. 독각선의 정밀도는 1.00, 삽벌레의 정밀도는 0.01이다.이 수치만 보면 딱정벌레를 정확하게 판별할 수 있는 뛰어난 수치(정밀도 1.0)라고 할 수는 없지만, 재현율 0.50에서 보면 거의 모든 검증 데이터가 딱정벌레로 판정되는데...아무 의미 없는 판정기라고 생각해요.

삽벌레의 이미지를 실제로 분석한 결과 다음과 같은 느낌이 든다.우선, AWS Rekognition의 원래 모델 물체 식별 추출 영역입니다.각 분야에 대해 이미지 분류를 실시한 것 같다.이 그림에서 가장 삽벌레 같은 가위 부분은 녹색 영역에서 삽벌레로 여겨진다.뭐, 이것만으로도 오늘은 만족해.

끝말


성능(정밀도와 재현율)을 높이기 위해서는 당연히 데이터를 배우는 데 공을 들여야 한다.Amazon Rekognition Custom Labels를 접한 결과, AI 판정 이미지를 손쉽게 제작할 수 있다는 사실이 밝혀졌다.리코그니션이기 때문에 당연히 AWS 람다에서 간단하게 불러낼 수 있기 때문에 응용에서도 간단하다.이미지 판정 AI를 만들 때'학습 데이터만 준비'에 집중할 수 있다는 것이다.대단하다.앞으로 성능을 높이는 학습 데이터의 응당 상태 등에 힘쓰고 싶습니다.

좋은 웹페이지 즐겨찾기