[DataRobot] DataRobot AI Plaatform의 시용 신청부터 예측까지

개시하다


안녕하세요.
@yshr10ic의 DataRobot 주제 기고문입니다.
DataRobot의 AI 플랫폼을 경험해 볼 수 있어서 어렵게 기회가 생겨 Qiita에 기고하고 싶어요!

DataRobot이란?


DataRobot사가 제공하는 기업을 위한 AI 플랫폼입니다.DataRobot은 AI의 구축, 설계, 유지보수 전반을 자동화할 수 있는 데이터 과학의 민주화를 강조한다.
DataRobot에서는 No.1이 된 사람하일제과 톱 데이터 과학자가 재적해 이들의 기술 노하우를 자동으로 활용할 수 있는 플랫폼이 많이 됐다.
이러한 DataRobot의 AI 플랫폼은 오늘(2020년/07/01)부터 시범 운영을 시작한다.기회는 얻기 어려우니 한번 해 보고 싶다!
Kaggle

시행판 신청


DataRobot의 일본 내'DataRobot AI Plaatform 평가판'출시로부터 DataRobot AI Plaatform 시용을 신청할 수 있다.
여기.
필요사항을 작성한 뒤'발송'버튼을 클릭하면 가입된 메일 주소로 메일이 배달되고, 링크를 클릭하면 비밀번호가 설정된다.
로그인 후 다음 페이지로 이동합니다.블랙 기조로 디자인이 멋스럽네요!

이것은 시험판과 유상판에서 사용할 수 있는 기능 일람표다.

실제 예측


이번에는 DataRobot AI Plaatform에서 준비한 샘플 데이터 세트로 예측해보려고 합니다.
첫 페이지의'꿈의 야구팀 예측'에서'창설 프로젝트'를 클릭하세요.

이렇게 되면 데이터의 업로드, 데이터의 읽기, 탐색적인 데이터 해석이 진행된다.

데이터 분석이 끝나면 다음과 같은 예측을 하게 된다.

데이터 품질 항목에서는 피쳐 양의 수, 데이터 행의 수, 편차 값 유무를 확인할 수 있습니다.이번 데이터는 98개의 특징량, 14060개의 데이터 수가 있다.

다음은 각 특징량의 기본 통계량을 확인할 수 있다.
또한 데이터 품질의 열에의 특징량이 있는데 이것은 이번 데이터에 편차 값을 포함하는 특징량이다.몸무게의 최소치와 최대치(가능한 단위는 파운드), 최소치 140파운드(≈63.5kg), 최대치 295파운드(≈133.8kg)를 확인했는데 야구선수 133kg은 너무 무거워 적절한 검사를 했다고 할 수 있다.
몸무게만큼 편차값이 뚜렷한 특징량은 좋지만, 딱 봐도 편차값인지 아닌지 알 수 없는 특징량도 데이터 세트에 꼭 포함돼 있기 때문에 데이터의 질을 자동으로 확인할 수 있어 감사하다.

이번에는'wOBA'를 예측 대상으로 삼고 싶다.그나저나 wOBA는 Weighted On-Base Average의 줄임말로 타자의 공격력을 가늠하는 지표다.(참조
화면 맨 위로 돌아가서 추천 대상의 wOBA를 클릭합니다.
Wikipedia
이렇게 되면 자동으로'회귀'예측을 선택하고 시작 버튼을 누르면 된다.

또한 고급 옵션이 표시되면 다양한 방법을 시도할 수 있습니다.


이번에는 기본 설정에 따라 시작 버튼을 누르세요.
그러면 모델링이 실행될 것이다.아래와 같이 각양각색의 모델을 이용하여 예측한다.시간이 좀 걸릴 것으로 예상되니 커피를 마시면서 참을성 있게 기다리세요

공부 끝!

왼쪽 위 모서리의 모델 레이블을 누르면 제작된 모델의 일람표를 표시할 수 있습니다.이번에는 23개의 모형을 만든 것 같다.교차 검사에서 점수가 좋은 순서로 배열되어 있는 것 같아요.
또 아래로 스크롤해 보면'검정'의 평가치가 낮은 모델은 교차 검정을 하지 않은 것 같아 그래도 모델링 시간을 단축시켰다.


모형을 클릭하면 그 모형이 어떻게 구성되고 어떤 특징량이 충격적인지 등을 조사할 수 있다.확인할 수 있는 항목이 많기 때문에 이런 것들을 확인하는 것은 좀 어려울 것 같다.


그럼 이 맨 위에 있는 모형으로 예측하고 싶어요!
모델을 선택하면 예측 탭이 표시되므로 여기를 클릭합니다.이번에는 예측용 데이터 세트를 준비해서 다운로드해서 올리고 싶어요.

업로드가 완료되면 예측 계산을 클릭합니다.

예측용 데이터 집합은 283줄로 1분도 안 돼 예측이 완성됐다.예측 결과를 다운로드하여 결과를 확인하고 싶습니다.

잘 예측했어!CSV 클릭 버튼만 올리면 예측할 수 있어 간단하네요!

총결산


어때요?DataRobot AI Plaatform의 시용 신청에서 샘플 데이터를 사용하는 모델의 학습과 예측을 시도했다.모델링에 사용할 수 있는 옵션과 결과 확인 항목 등이 워낙 많아 다 확인할 수는 없지만, GUI에서 버튼만 누르면 이 정도까지 할 수 있다는 게 대단하다고 생각했어요.
이번에는 DataRobot AI Plaatform에 있는 샘플 데이터를 활용해 학습~예측을 진행했기 때문에 이번에는 자신에게 익숙한 데이터로 시도해보려고 한다.
이번 기사는 여기까지입니다.끝까지 읽어주셔서 감사합니다!
참고 가치가 있습니다!이런 분이 LGTM의 격려를 받을 수 있다면 잘 부탁드립니다!

좋은 웹페이지 즐겨찾기