Notebook 환경

Google Colaboratory

정확도 (Accuracy)

정확도는 실제 데이터에서 예측 데이터가 얼마나 같은지를 판단 하는 지표

$$ Accuracy = \frac{num\_correct}{num\_data} $$

직관적이지만, 데이터의 구성에 따라 ML 모델의 성능을 왜곡할 수 있기에, 정확도만으로 성능을 평가하지 않는다

오차 행렬 (Confusion Matrix), 정밀도, 재현율

오차 행렬이란, 모델이 예측을 수행하면서 얼마나 헷갈리고 있는지도 함께 보여주는 지표다

실제 클래스 \ 예측 Negative (0) Positive (1)
Negative (0) TN (True Negative) FP (False Positive)
Positive (1) FN (False Negative) TP (True Positive)
from sklearn.metrics import confusion_matrix

confusion_matrix(y_test, predictions)

정밀도/재현율 트레이드오프

정밀도 또는 재현율이 강조돼야 할 경우, 분류의 결정 임곗값 (Threshold)를 조정해 수치를 높일 수 있다