기계 학습 시작: 모델의 메커니즘

시나리오



해외에 사는 가장 친한 친구가 부동산 투자로 수천만엔을 벌었습니다. 비즈니스를 전파하고 싶기 때문에, 당신을 「비즈니스 파트너가 되어 주지 않겠습니까?」라고 초대합니다. 그가 돈을 내고 데이터 분석 기술을 가진 당신이 부동산의 가격을 예측하는 패턴 (모델)을 만듭니다.

결정 나무 (Decision Tree)



"어떻게 물건의 가격을 예측, 판단하고 있는지"라고 당신이 들었습니다.
「직감이야」라고 대답되었습니다.
기계 학습으로 직감으로 가격 예측 모델을 만드는 것은 있을 수 없을까요?
좀 더 상세하게 듣고, 당신이 어쩐지 알았습니다.


부동산 가격은 두 그룹으로 나뉩니다.

즉, 물건 가격의 예측은, 이하 2 단계로 행해집니다.
1. 부동산을 두 그룹으로 나누기
2. 그룹당 가격 설정

이 절차를 피팅 모델 또는 트레이닝 모델이라고합니다.
모델을 fit하는 데이터를 training data라고 합니다.

fit한 모델을 사용하여 투자하려는 부동산의 가격을 예측하세요.

모델 개선



어떤 결정 트리가 training data에 맞는가?


보통으로 생각하면, 결정 나무 1 쪽이 좋다고 생각되네요. 큰 부동산이 작은 것보다 높을 것입니까? 다만, 크기만으로 물건 가격이 정해지는 것은 아니네요. 그 밖에도 부동산 가격에 영향을 미치는 많은 요인(장소, 구축 연도 등)이 있습니다.
다른 요인을 포함하여 결정 트리는 다음과 같습니다.


부동산의 특징에 적합한 경로를 선택하면 예측 가격이 결정 트리의 바닥 노드에 있습니다.
예측 물가가 있는 바닥 노드를 leaf라고 합니다.

다음



결정 트리의 분기 수와 leaf 값은 데이터에 의해 결정됩니다.
다음에 데이터 분석을 해보겠습니다.

다른 관련 기사는 여기입니다.

좋은 웹페이지 즐겨찾기