기계 학습 훈련 데이터의 분할, 학습, 예측, 검증
내가 이 부분을 설명할게.
전제 조건
pydatatokyo_tutorial_ml.ipynb
트레이닝 데이터 분할
피쳐 행렬X
클래스 레이블 데이터y
데이터 분할을 수행할 수 있습니다.from sklearn.model_selection import train_test_split
X_train, X_val, y_train, y_val = train_test_split(X, y, train_size=0.8, random_state=1)
from sklearn.model_selection import train_test_split
X_train, X_val, y_train, y_val = train_test_split(X, y, train_size=0.8, random_state=1)
학습, 예측, 검증
분류기(학습기)의 초기화
from sklearn.linear_model import LogisticRegression
clf = LogisticRegression()
clf를 초기화하여 다음과 같은 학습, 예측, 검증에 사용합니다.
배우다
clf.fit(X_train, y_train)
초기화된 clf의fit 방법을 사용하여 학습
데이터가 80%의 학습 데이터에 특징 매트릭스와 클래스 라벨을 제공한다
예측
y_train_pred = clf.predict(X_train)
y_val_pred = clf.predict(X_val)
clf의predict 방법으로 예측합니다.
from sklearn.linear_model import LogisticRegression
clf = LogisticRegression()
clf.fit(X_train, y_train)
y_train_pred = clf.predict(X_train)
y_val_pred = clf.predict(X_val)
y_train_pred
: 학습용 데이터로 다시 예측한 결과y_val_pred
: 평가용 데이터로 예측한 결과y_val
.즉, y_train
를 알 수 없는 데이터로 처리평가/검증
from sklearn.metrics import accuracy_score
train_score = accuracy_score(y_train, y_train_pred)
val_score = accuracy_score(y_val, y_val_pred)
accuracy_score
주고クラスラベルデータ
와上記の予測結果
, 출력 정답률Reference
이 문제에 관하여(기계 학습 훈련 데이터의 분할, 학습, 예측, 검증), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다 https://qiita.com/terapyon/items/8f8d3518ee8eeb4f96b2텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념 (Collection and Share based on the CC Protocol.)