混同行列(Confusion Matrix)とは、分類モデルの予測結果を真陽性(TP)、偽陽性(FP)、真陰性(TN)、偽陰性(FN)の4つのカテゴリに分類して表形式にまとめたものです。モデルの性能を多角的に評価するための基礎となります。
4つの要素
真陽性(TP):正しく陽性と予測。偽陽性(FP):誤って陽性と予測(第1種の過誤)。真陰性(TN):正しく陰性と予測。偽陰性(FN):誤って陰性と予測(第2種の過誤)。
混同行列から算出される指標
精度(Accuracy)= (TP+TN)/(TP+FP+TN+FN)、適合率(Precision)= TP/(TP+FP)、再現率(Recall)= TP/(TP+FN)、F値 = 2×Precision×Recall/(Precision+Recall) など、様々な評価指標を算出できます。
多クラス分類での拡張
2クラスの場合は2×2の行列ですが、Kクラスの場合はK×Kの行列に拡張されます。対角成分が正しい予測、非対角成分が誤分類を表し、どのクラス間で混同が多いかを分析できます。