AIFFEL 2022.01.06

Exploration 2

오차 행렬 (confusion matrix)


코로나 환자 검측 예시

  • TP(True Positive) : 실제 환자에게 양성판정 (참 양성)

  • FN(False Negative) : 실제 환자에게 음성판정 (거짓 음성)

  • FP(False Positive) : 건강한 사람에게 양성판정 (거짓 양성)

  • TN(True Negative) : 건강한 사람에게 음성판정 (참 음성)

  • 정밀도(precision) : 양성으로 예측한 놈들 중에서, 실제로 양성인 놈이 얼마나 있는가?
    Precision이 크려면 음성인데 양성으로 판단하는 경우가 적어야 합니다. 음성을 놓치지 말아야 한다는 거죠! 어떤 경우가 있을까요? 스팸메일 필터

  • 재현율(recall = sensitivity(민감도)) : 실제로 양성인 놈들을, 얼마나 예측해냈는가?
    Recall이 크려면 양성인데 음성으로 판단하는 경우가 적어야 합니다. 양성을 놓치지 말아야 하죠. 이건 어떤 경우가 있을까요? 암환자 진단

  • F1 Score : Recall과 Precision의 조화평균

  • Accuracy : 전체 데이터 중 올바르게 판단한 데이터 개수의 비율

from sklearn.metrics import confusion_matrix

confusion_matrix(y_test, y_pred)

precision    recall  f1-score   support

           0       1.00      1.00      1.00        11
           1       1.00      0.83      0.91        12
           2       0.78      1.00      0.88         7

    accuracy                           0.93        30
   macro avg       0.93      0.94      0.93        30
weighted avg       0.95      0.93      0.93        30

Support Vector Machine (SVM)

  • support(vector) : Decision Boundary에 가까이 있는 데이터
  • Margin: Decision Boundary와 Support Vector 사이의 거리

좋은 웹페이지 즐겨찾기