2.2.2_Random_Forests
[키워드]
- Random Forest
- Bagging ~ Bootstrapping & OOB-Error
- Ordinal Encoding
[학습내용]
- Ordinal Encoding
: 트리 모델에서는 원핫인코딩으로 변수가 늘어나고 범주가 많은 변수는 상위노드에서 중요변수가 분할될 때 선택할 가능성이 낮아지기 때문에 Ordinal Encoding을 사용하는 것이 더 나음
from category_encoders import OrdinalEncoder
- 트리앙상블모델 vs 결정트리모델
결정트리모델에 비해 트리앙상블모델은 랜덤성을 통해 과적합 방지랜덤포레스트에서는 각 결정트리가 배깅을 통해 만들어짐 -> 데이터가 중복추출되므로 랜덤성 생김
각 트리는 분기에서 무작위로 선택된 특성을 선택함 -> 랜덤성 생김
from sklearn.ensemble import RandomForestClassifier
[찾아볼 내용]👀
- OOB-Sample and OOB-Error
Author And Source
이 문제에 관하여(2.2.2_Random_Forests), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다 https://velog.io/@winocas/bootcamp21저자 귀속: 원작자 정보가 원작자 URL에 포함되어 있으며 저작권은 원작자 소유입니다.
우수한 개발자 콘텐츠 발견에 전념 (Collection and Share based on the CC Protocol.)