Confusion matrix
Confusion matrix는 Contingency table 또는 An error matrix라고도 표현되는데, 이는 주로 알고리즘의 성능을 평가할 때, 평가하는 지표로 많이 사용된다.
오차행렬, 분류행렬, 혼동행렬 등으로 불린다. (정확한 한글 명칭은 unknown)
Categoreis
Terminology and derivations
- true positive (TP)
- eqv. with hit
- true negative (TN)
- eqv. with correct rejection
- false positive (FP)
- eqv. with false alarm, Type I error
- false negative (FN)
- eqv. with miss, Type II error
Table of confusion
Predicted | |||
P' | n' | ||
Actual | P | TP | FN |
n | FP | TN |
Confusion matrix에서 'True/False'는 실제 값이 1이냐 0이냐를 맞췄는지를 나타냄. 즉, 'True'는 실제와 예측이 일치하는경우 이며, 'False'는 실제와 예측이 불일치하는 경우를 말함. 'Positive/Negative'는 예측한 값이 1이냐 0이냐를 의미함.
- <span style="background:green;">TP의 경우 1라고 예측했는데, 실제로도 1인 경우 (정답)
- <span style="background:green;">TN의 경우 0라고 예측했고, 실제값 또한 0인 경우 (정답)
- <span style="background:red;">FP의 경우 1라고 예측했으나, 실제값은 0인 경우,
- <span style="background:red;">FN의 경우 0라고 예측했는데, 실제로는 1인 경우,
- Precision
-
TP / TP+FP
- 즉, 1이라고 예측한 것 중 실제 값이 1인 것 --> 내가 푼 문제 중에 맞춘 정답 개수 (1에 가까울수록 좋다)
- Recall (=sensitivity)
-
TP / TP+FN
- 즉, 실제 값이 1인 것 중 1이라고 예측한 것 --> 전체 1 중에서 내가 몇개를 맞췄는가 (1에 가까울수록 좋다)
- Accuracy (전체 중에서 올바르게 예측한 것이 몇개인지)
-
TP + TN / TP+TN+FP+FN
- 즉, 전체 경우의 수 중에서 True로 행동한 비율 (1에 가까울수록 좋다)
See also
Favorite site
References
-
Kmkim1222-Confusion_matrix.pdf ↩