마이크로소프트의 Custom Vision으로 놀면 생각보다 대단한 서비스입니다.

입문


나는 마이크로소프트 개발자를 위한 이벤트 de:code 2017에 갔다.
최근 눈에 띄는 기술은 거의 해외산이어서 정보는 영어로만 구입할 수 있다
일본어로 최신 기술을 배울 수 있는 이 기회를 갖게 되어 매우 기쁩니다.
인상적인 것은 돌아가기 쉬운 서협과 미디어 예술가가 낙합한 회의에서 내 아들의 사진이 나왔다는 것이다.
깜짝이야.
이 문장의 이 사진입니다.
image.png
서협 선생
사용해 주셔서 감사합니다.m(_ _)m
저는 바로 그 회의에서 소개한 사용자 정의 Vision을 시도했습니다.
나는 그 결과를 써 보려고 한다.
나는 기다릴 수 없다. 내가 먼저 말했다
이 기술은 정말 대단하다!
마이크로소프트는 왜 이 기능을 더욱 눈에 띄게 발표하지 않습니까?
나는 이것이 사람들의 생활에 강렬한 충격을 주는 제품이라고 생각한다.
이게 있다면 이미지에서 검색할 수 있는 위키백과를 만들 수 있을 거예요!
현재 이렇게 되면 마이크로소프트 등 한 기업이 단독으로 데이터를 수집하는 데는 한계가 있다
이 사용자 정의 Vision을 사용하면 개인이 자신의 두뇌(데이터 모델)를 만들 수 있다
위키백과처럼 다 같이 가져오면 상당히 섬세한 지혜를 모을 수 있을 거라고 생각해요.
물고기와 식물의 종류인 그물은 최근에 반드시 달성할 수 있겠지.
마이크로소프트는 위키백과처럼 모두가 모델을 공유할 수 있는 장소를 만들어야 한다.
공유의 장을 만들고 모델이 모이면 이 분야는 마이크로소프트의 독주 무대가 되기 때문에 마이크로소프트에도 큰 장점이 있다.

사용자 정의 Vision이 할 수 있는 일


① 왕도의 이미지에서 검색하는 용도
Microsoft Future Vision의 영상에 나오는 카메라를 맞추면 즉석에서 식물의 이름과 설명을 꺼내는 기능이 먼저 유행할 것이라고 생각합니다.
https://www.youtube.com/watch?v=ozLaklIFWUI
편의점 상품도 가능하니 바코드에서 이미지 인식으로 바꾸자.
사람이 외부에서 정보를 얻는 방법은 거의'시각에서 온 영상','문자','청각에서 온 소리'등 3가지이다
사람들이 생활 속에서 의문을 느끼는 것은 거의 전부 검색 조사를 할 수 있다.
② 사람의 취향을 모형화한 용도
우리는 사람이 외모에 대해 어떻게 생각하는지 모형화하고 공유할 수 있다.예를 들어 수백 명 정도의 이성의 얼굴을 관찰해 호불호를 판별하면 그 사람의 얼굴을 판별할 수 있는 취향의 모델이 만들어진다(응당).그'이성의 얼굴의 호불호 모델'을 결혼소개소에 맡기면 매칭 성공률이 비약적으로 높아지겠죠.
처음에는 프라이버시를 신경 쓸 수도 있지만 당장 자신이 좋아하는 모델을 다른 사람에게 맡기는 시대가 아닐까 싶어요.
옷의 취향을 모델화해 옷가게에 맡기면 취향에 맞는 옷을 상당히 정밀하게 추천할 수 있다.
겉모습이 중요한 사업에 보급될 것 같다.옷가게, 애완동물가게, 미용실 등.

이번에 Custom Vision에서 시도한 거.


베이블레이드라는 베이고마 초진화판 바둑돌이 초등학생들 사이에서 유행하고 있다.
지금도 아이들의 기분을 고조시키는 애니메이션이 방영되어 인기를 끌고 있다.
그래서 우리 초등학교 2학년 아들과 함께 있을 때는 거의 베이블레이드와 사귀던 오늘 이맘때였어요.
그 베이블레이드 생활에서 나온 과제, 그걸 해결하기 위해서.
나는 이 인류의 지혜를 사용해 보기로 결정했다.
과제는 베이의 칼날이 종류가 많고 바둑알의 이름이 너무 어려워서 기억이 나지 않는다는 것이다.
'깔때기 파브닐','범그핀릴'같은 가명을 어떻게 이렇게 긴 이름을 기억할 수 있겠어!
그래서 미소를 지으면 이름이 나왔으면 좋겠어요.
그리고 아이와 함께 해 봤어요.

학습 과정


이 서비스는 이미지를 태그와 함께 등록하기만 하면 됩니다.라벨 한 개당 5장 이상이 필요합니다.5장만으로 좋아지기 위해 미리 공부하다니 놀랍다.
① 베이블레이드를 바닥에 놓고 정면으로 향하는 사진을 촬영한다

②①과 같은 곳에서 첫 번째 마주보는 사진을 찍는다

③ 밝기가 다른 곳에서 ①과 ②와 같은 조건으로 사진을 찍는다
※ 사진은 생략
④ 회전 상태를 촬영한 사진

⑤ 가장 이해하기 쉬운 사진 찍기

⑥ 촬영한 사진을 바둑돌 이름으로 태그하여 서비스에 등록

⑦ 6개의 바둑알을 반복하는 위 단계
테스트 프로세스
① 테스트용 사진 촬영
그 바둑돌을 사진의 주요 촬영으로 삼기 위해 찍었다.컨디션이 각양각색이다.
② 신속한 서비스 테스트를 통한 테스트

테스트 결과


1번째

정답!
아, 가까운 사진이 있어서요.
나는 이것과 비슷한 사진 7종을 시험해 보았는데, 완전히 정확했다.
두 번째

정답.
오, 이것도 남들이 보기엔 헷갈리지만 잘 어울려요.
다른 돌돌 사진들도 OK.
결국 자신이 찍은 사진은 100% 정확했다.

추가 테스트


자기가 찍은 사진이 아니라 인터넷에서 찍은 사진이 어때요?
1번째

어?
정답 사진인데 안 돼요.
두 번째

이것도 안돼.
세 번째

이것도 안 되는데.
네 번째

이거 오케이!
5번째

이것도 OK.
나는 지금 OK한 사진과 안 되는 사진을 모른다.
아마도 사진 가공 소프트웨어로 가공된 사진은 기계적인 시각에서 보면 이상하겠지.

결과 견해

  • 같은 카메라로 촬영할 때 정밀도가 상당히 높다.이 사용 방법은 실용적인 수준으로 여겨진다.
    예를 들어 회사 내 전원이 아이폰 카메라를 사용하는 규칙에 따라 정밀도가 상당히 높아진다.
  • 인터넷에서 얻은 사진에서 정답을 맞히지 못할 때의 이유는 다른 사람이 보기에는 알 수 없기 때문에 다시 한 번 분석해야 한다.하지만 사진에 따라 사람과는 다른 느낌치가 있으니 주의해야 한다고 할 수 있다.
  • 결과와 사람의 감각치가 다른 이유, 사진 가공을 했기 때문이라면 검측된 구조 등의 정비를 병행하면 신뢰도가 더욱 높아진다
  • 끝날 때


    타카라토미 씨!
    이번에 제가 만든 베이블레이드 판별 프로그램은 아이에게 받아들여질 수 있으니 하세요.단순히 이름만 말하는 게 아니라 카메라로 사진을 찍으면 바둑알마다 다른 효과를 내는 사진으로 가공할 수 있다면 난리가 날 것 같으니 꼭 오세요.
    페이스북이 지난 F8에서 발표한'실시간으로 애니메이션 효과를 부여할 수 있다'는 기능과 같은 기술로 전진해 휴대전화 카메라를 바둑돌로 향하면 효과가 부여된 이미지를 실시간으로 볼 수 있을 것이다.
    인상은 이렇다.아이패드 옆에서 바둑알을 보면 바둑알 뒤에 빛나는 잔상 같은 효과가 나타난다

    이를 실현하기 위한 기술은 어느 정도까지 진전되었을까.
    나는 현재의 기술로 상당히 좋은 선에 접근할 수 있다고 생각하기 때문에 다시 한 번 조사하고 싶다.
    지금까지 조금 높은 애들이랑 놀았어요.

    좋은 웹페이지 즐겨찾기