No.Code를 통해 코로나 콜센터의 상담 건수를 예측하다
도쿄도가 오픈 데이터를 제공했기 때문에 DataRobot의 AutomL로 위풍당당한 일관 관련 분석을 분석해보고 싶다.
차리다
DataRobot의 데모 계정 만들기
도쿄도에서 데이터 디렉터리 사이트를 개방하여 데이터 집합을 얻다
아주 쉽게 이용할 수 있는 데이터 집합을 제공하여 나는 매우 놀랐다.일본 대단하다!!
다운로드도쿄도 신형 멀미 센터 상담 건수 CSV
데이터로봇으로 예측
데이터 정리
이전 CSV 파일을 업로드하는 데 액세스여기.!
잠시 후 데이터가 읽혀져서 이렇게 보일 것이다.
아래로 스크롤해서 데이터 집합을 보십시오.
손실치가 없으니 좋은 데이터 집합이다!
모델 선택
이번에는 상의건수를 예측하고자 목표명에'상의건수'를 입력한 것이다.
이번에는 시간 서열을 처리하는 데이터 집합이기 때문에 시간 식별 모델을 선택했다.
주시간의 특징량
年_月_日
을 나타내기 때문에 선택한다.시간 시퀀스 모델링과 시간 외 검정(OVA)은 원래 선택할 수 있지만, 시험 실행 중 시간 외 검정만 선택할 수 있기 때문에 그 시작을 선택하세요!
배우다
이런 느낌으로 공부를 해요.제대로 측정한 적은 없지만 체감은 3~5분 정도면 공부가 끝난다.
평점
모델을 선택하면 다양한 모델을 학습한 결과가 한눈에 들어온다.
시간 시퀀스 데이터에 대해 점수를 매기는 것과 점수를 매기지 않는 것이 있다.
예측
점수가 없어 잘 모르겠지만 제안된 DEPRO
RandomForest Regressor
로 데이터를 예측해 보세요.모델을 선택하면 파란색 플롯이 표시됩니다.예측을 선택합니다.
예측을 위해 미래 날짜가 들어간 CSV를 올리는 게 좋을 것 같아 방금 다운로드한 도쿄도의 데이터세트를 열고 날짜와 요일, 상의 건수를 조정해 데이터를 다시 만들었다.
CSV로 저장하고 업로드합니다.
이렇게 되면 예측이 시작되고 조금 있으면 예측 결과를 다운로드할 수 있다.
다운로드해보면 rowID와 Prediction이 적힌 CSV가 있습니다.
날짜의 CSV와 병렬하여 예측치를 보십시오.
데이터 세트 마지막 쪽의 날짜를 보면 900 안팎에서 이동하기 때문에 편차 값이 아니라 대체적으로 있는 수치다.
7/8 이후 도쿄의 데이터 집합이 업데이트되면 데이터가 얼마나 정확한지 다시 보고 싶습니다.
2010/07/110:02 추기
예측한 부분의 데이터가 나왔지만 실제 측정치는
7/8 => 912
7/9=>1174
예측
7/8 => 961
7/9 => 958
의 오차가 명확해졌다!
최근 도쿄의 감염자 수가 과거 최대로 늘자 언론이 다시 불안을 부추기기 시작한 것은 이 때문에 7/9이 증가하고 있는 것으로 보인다.
총결산
DataRobot을 사용하면 ML 지식이 별로 없어도 데이터 과학을 할 수 있습니다!
당연한 일일지 몰라도 데이터의 품질을 평가해 보니 대단하다고 생각한다.(ML에서 데이터의 사전 처리가 중요하다)
만약 또 기회가 있다면, 나는 업무 중에 이용하고 싶다!
Reference
이 문제에 관하여(No.Code를 통해 코로나 콜센터의 상담 건수를 예측하다), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다 https://qiita.com/serinuntius/items/d6f1c2612d6bb5a290f8텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념 (Collection and Share based on the CC Protocol.)