Azure Machine Learning에서 AutoML을 시도했습니다.

소개



이전에, 기계 학습의 공부로서, Kaggle의 튜토리얼인 「Titanic: Machine Learning from Disaster」에 도전했습니다. 그 때의 기사는 이쪽입니다. → 【Kaggle 튜토리얼】타이타닉호로 살아남는 것은?

이번에는 이것을 같은 데이터를 사용하여 Azure Machine Learning에서 AutoML 기능을 시험해보고 싶습니다.

거친 흐름



거친 흐름은 다음과 같습니다.

1에서 4까지는, 이쪽의 기사 「 AutoML (자동 기계 학습)을 이용한 시계열 데이터 예측 를 참고로 해 주셔 실행했습니다.

1. Azure Machine Learning 만들기
2. Azure Machine Learning Studio 시작
3. 컴퓨팅 인스턴스 만들기
4. 교육 클러스터 만들기
5. Automated ML 생성 및 실행
6. 결과 확인

5. Automated ML 생성 및 실행



Automated ML(preview)을 열고 새로운 자동 ML 실행의 작성에 들어갑니다.
  우선, 데이터 세트의 작성으로부터. 나는 로컬 파일에서 만들고 있습니다.
이런 다이얼로그가 열리므로, 적당한 이름을 붙여 다음에 진행합니다.



  그런 다음 파일을 업로드하지만 '열 머리글' 항목에서 '첫 번째 파일 헤더 사용'을 선택하는 것을 잊지 마십시오. 화면 하단의 미리보기도 문제가 없는지 확인하면 다음.



데이터 세트를 작성할 수 있으면 실행을 구성합니다.
 실험명, 타겟 열(여기에서는, 「Survived」), 컴퓨팅 클러스터의 선택을 하고, 다음.



마지막으로 작업 분류를 선택합니다. 이번에는 딥 러닝을 사용하지 않고.



마침을 누르면 AutoML이 실행됩니다!



6. 결과 확인



나의 경우, 1시간 52분에 실행이 종료했습니다.

다양한 알고리즘이 시도되었지만 가장 좋은 것은 VotingEnsemble이었습니다.



"설명 표시"를 누르면 어떤 특징량이 효과가 있었는지 알 수 있습니다.
이번에는 Fare(운임), Age(연령)가 중요했던 느낌일까요?
 


정확도도 이렇게 그래픽으로 표시됩니다.


결론



이번은, 우선 AutoML이라고 하는 것이 어떤 것인가, 아마추어라도 사용할 수 있는지, 등을 시험하는 의미로, 타이타닉의 데이터로 움직여 보았습니다.

일단, 2시간 정도로 움직일 수는 있었습니다만, 잘 다루기에는 기억하는 것이, 아직도 많이 있다고 하는 인상입니다. AI의 민주화, 같은 키워드가 있습니다만, 그렇게 달지 않고, IT, 클라우드, 데이터 사이언스등의 기초 지식이 나름대로 필요하고, 누구라도 간단하게, 라고 하는 레벨인가는 미묘한 인상이었습니다.

앞으로는 다른 데이터나 태스크에서의 시행착오, 완성된 모델의 보다 깊은 분석이나, 이 모델을 어딘가에 배포해 추론시켜 보거나, 가동을 감시하는 기능의 검증을 해보자 라고 생각합니다.

좋은 웹페이지 즐겨찾기