[선형 회귀] Performance measure

Linear Regression :: Performance Measure

우리가 만든 모델이 얼마나 실제 값을 잘 대변하는가에 대한 것을 평가할 수 있는 measure가 필요하다.

Mean Absolute Error (MAE)

from sklearn.metrics import median_absolute_error

y_true = [3, -0.5, 2, 7]
y_pred = [2.5, 0.0, 2, 8]

median_absolute_error(y_true, y_pred)

0.5

Root Mean Squared Error (RMSE)

from sklearn.metrics import mean_squared_error

y_true = [3, -0.5, 2, 7]
y_pred = [2.5, 0.0, 2, 8]

mean_squared_error(y_true, y_pred)

0.375

R squared

0과 1사이 숫자로 크면 클 수록 높은 적합도를 지님

from sklearn.metrics import r2_score

y_true = [3, -0.5, 2, 7]
y_pred = [2.5, 0.0, 2, 8]

r2_score(y_true, y_pred)

0.9486081370449679

Training & Test data set

Training 한 데이터로 다시 Test를 할 경우, Training 데이터에 과도하게 fitting된 모델이 사용될 수 있음
새로운 데이터가 출현했을 때, 기존 모델과의 차이 존재
모델은 새로운 데이터가 처리 가능하도록 generalize 되어야 함
이를 위해 training set과 test set을 분리함

General ML Process Training / Test Set

Hold-out Method(Sampling)

데이터를 Training과 Test와 나눠서 모델을 생성하고 테스트하는 기법
가장 일반적인 모델 생성을 위한 데이터 랜덤 샘플링 기법
Training과 Test를 나누는 비율은 데이터의 크기에 따라 다름
일반적으로 Training Data 2/3, Test Data 1/3 를 활용함

import numpy as np
from sklearn.model_selection import train_test_split

X,y=np.arange(10).reshape((5,2)), range(5)

X_train, X_test, y_train, y_test = train_test_split(X,y,test_size=0.33, random_state=42)

https://www.boostcourse.org/ai222/lecture/24516

Author And Source

이 문제에 관하여([선형 회귀] Performance measure), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다 https://velog.io/@ssongplay/선형-회귀-Performance-measure

우수한 개발자 콘텐츠 발견에 전념 (Collection and Share based on the CC Protocol.)

좋은 웹페이지 즐겨찾기

개발자 우수 사이트 수집

개발자가 알아야 할 필수 사이트 100선 추천 우리는 당신을 위해 100개의 자주 사용하는 개발자 학습 사이트를 정리했습니다