AWS ML University의 아마존 SageMaker Ground Truth 애니메이션을 번역해 봤습니다.

입문


Re:Invent 2018에서 발표된 아마존 SageMaker의 추가 기능인 Groud Truth에 관해서는 AWS ML University에서 제공한 애니메이션을 번역하면서 소개하고 싶습니다.
내용의 접근 방법은 여기에 기재되어 있다.
또한 Ground Truth를 실제로 시도했다는 보도는 다음과 같다.
아마존 SageMaker Ground Truth 시도

아마존 SageMaker Ground Truth


개요



Ground Truth는 아마존 SageMaker에서 기계 학습에 필요한 데이터 집합을 신속하고 정확하게 표시할 수 있는 새로운 기능이다.AWS에서 제공하는 알고리즘을 통해 보다 정확한 데이터로 변환하여 데이터 세트의 레이블화를 자동으로 수행합니다.

학습 데이터 준비 과제



일반적인 학습 데이터를 만드는 것은 대량의 정력과 오류를 소모하는 작업이다.학습 데이터를 만드는 데는 많은 사람이 필요하기 때문에 결과적으로 원가와 오류가 증가할 수 있다.그리고 복잡한 공정이 되기 위해서는 몇 개월이 걸리는 숙제를 해야 한다.

그룹을 통한 솔루션 이동



Ground Truth는 이러한 문제를 해결하는 기능을 제공합니다.
  • S3의 데이터를 이용하여 간단하게 고정밀 데이터 라벨 제작
  • 클릭수를 통해 데이터의 라벨화를 완성할 수 있다
  • 유사한 레이블 작업에 템플릿 제공
  • 표기된 인재를 선택할 수 있는 세 가지 모델 제공
  • 데이터의 태그화 작업이 완료되면 데이터가 S3로 이동됩니다.이렇게 하면 고정밀의 데이터 라벨화를 실현할 수 있다.

    인공 태그화를 할 때 세 가지 옵션 중 하나를 선택할 수 있습니다.
  • 아마존 기계 Turk에 등록된 작업자
  • AWS Marketplace에 등록된 타사 공급업체 직원
  • 본사내에 있는 작업원

  • 그룹 포크로 표시


    Ground Truth가 고정밀 데이터 태그화를 실현할 수 있었던 것은 UX 기술의 진화와 내장 알고리즘 때문이다.이 UX는 모든 템플릿에 설치되어 태그화된 작업을 지원합니다.

    Ground Truth는 위의 그림과 같이 보다 정밀한 데이터 태그화를 할 수 있는 구조입니다.Ground Truth에는 자동 태그화 기능이 탑재되어 있습니다.이렇게 하면 고정밀의 데이터 라벨화를 실현할 수 있다.

    자동 라벨화된 구조를 자세히 소개해 드리겠습니다.이 기능의 특징은 Ground Truth 측면에서 학습 데이터를 보고 Ground Truth의 데이터 이해도에 따라 자동 라벨화인지 수동으로 진행하는지 선택하는 것이다.

    상술한 바와 같이 지상 교통수단을 사용하면 세 가지 이익을 얻을 수 있다.
  • 태그 데이터의 비용을 70% 이상 절감
  • 데이터 세트를 안전하게 관리할 수 있음
  • 검증 데이터 세트의 정밀도 향상
  • 끝내다


    다음은 아마존 SageMaker Ground Truth의 애니메이션 내용을 요약한 것입니다.
    기계 학습 공정에서 9할 이상을 차지하는 학습 데이터의 준비는 극적으로 수월해진다.머신러닝 기술을 비즈니스에 도입할 때 문턱이 크게 떨어지겠죠.대단한 서비스가 곧 세상에 끊임없이 등장할 것이다!

    좋은 웹페이지 즐겨찾기