No.Code를 통해 코로나 콜센터의 상담 건수를 예측하다

요즘 Automl이 유행이에요!(자기 마음일 수도 있겠지 웃음)
도쿄도가 오픈 데이터를 제공했기 때문에 DataRobot의 AutomL로 위풍당당한 일관 관련 분석을 분석해보고 싶다.

차리다


DataRobot의 데모 계정 만들기


도쿄도에서 데이터 디렉터리 사이트를 개방하여 데이터 집합을 얻다


아주 쉽게 이용할 수 있는 데이터 집합을 제공하여 나는 매우 놀랐다.일본 대단하다!!
다운로드도쿄도 신형 멀미 센터 상담 건수 CSV


데이터로봇으로 예측


데이터 정리


이전 CSV 파일을 업로드하는 데 액세스여기.!

잠시 후 데이터가 읽혀져서 이렇게 보일 것이다.

아래로 스크롤해서 데이터 집합을 보십시오.
손실치가 없으니 좋은 데이터 집합이다!

모델 선택


이번에는 상의건수를 예측하고자 목표명에'상의건수'를 입력한 것이다.

이번에는 시간 서열을 처리하는 데이터 집합이기 때문에 시간 식별 모델을 선택했다.

주시간의 특징량年_月_日을 나타내기 때문에 선택한다.

시간 시퀀스 모델링과 시간 외 검정(OVA)은 원래 선택할 수 있지만, 시험 실행 중 시간 외 검정만 선택할 수 있기 때문에 그 시작을 선택하세요!

배우다


이런 느낌으로 공부를 해요.제대로 측정한 적은 없지만 체감은 3~5분 정도면 공부가 끝난다.

평점


모델을 선택하면 다양한 모델을 학습한 결과가 한눈에 들어온다.

시간 시퀀스 데이터에 대해 점수를 매기는 것과 점수를 매기지 않는 것이 있다.


예측


점수가 없어 잘 모르겠지만 제안된 DEPRORandomForest Regressor로 데이터를 예측해 보세요.
모델을 선택하면 파란색 플롯이 표시됩니다.예측을 선택합니다.

예측을 위해 미래 날짜가 들어간 CSV를 올리는 게 좋을 것 같아 방금 다운로드한 도쿄도의 데이터세트를 열고 날짜와 요일, 상의 건수를 조정해 데이터를 다시 만들었다.

CSV로 저장하고 업로드합니다.

이렇게 되면 예측이 시작되고 조금 있으면 예측 결과를 다운로드할 수 있다.

다운로드해보면 rowID와 Prediction이 적힌 CSV가 있습니다.
날짜의 CSV와 병렬하여 예측치를 보십시오.

데이터 세트 마지막 쪽의 날짜를 보면 900 안팎에서 이동하기 때문에 편차 값이 아니라 대체적으로 있는 수치다.

7/8 이후 도쿄의 데이터 집합이 업데이트되면 데이터가 얼마나 정확한지 다시 보고 싶습니다.

2010/07/110:02 추기



예측한 부분의 데이터가 나왔지만 실제 측정치는
7/8 => 912
7/9=>1174
예측
7/8 => 961
7/9 => 958
의 오차가 명확해졌다!
최근 도쿄의 감염자 수가 과거 최대로 늘자 언론이 다시 불안을 부추기기 시작한 것은 이 때문에 7/9이 증가하고 있는 것으로 보인다.

총결산


DataRobot을 사용하면 ML 지식이 별로 없어도 데이터 과학을 할 수 있습니다!
당연한 일일지 몰라도 데이터의 품질을 평가해 보니 대단하다고 생각한다.(ML에서 데이터의 사전 처리가 중요하다)
만약 또 기회가 있다면, 나는 업무 중에 이용하고 싶다!

좋은 웹페이지 즐겨찾기