混同行列とは
混同行列(Confusion Matrix)とは、分類モデルの予測結果を表形式でまとめた行列です。実際のクラスと予測されたクラスの組み合わせごとにサンプル数を整理することで、モデルがどのような種類の誤りを犯しているかを詳細に把握できます。
二値分類の混同行列
二値分類の混同行列は2x2の行列で、真陽性(TP:正しく陽性と予測)、真陰性(TN:正しく陰性と予測)、偽陽性(FP:誤って陽性と予測)、偽陰性(FN:誤って陰性と予測)の4つの要素で構成されます。これらの値から精度、適合率、再現率、F値、特異度など、さまざまな評価指標が導出されます。
多クラス分類の混同行列
多クラス分類では、クラス数がNの場合、N×Nの混同行列が作成されます。対角線上の要素が正しい予測数を示し、非対角線の要素がどのクラスがどのクラスに誤分類されやすいかを示します。これにより、特定のクラス間で混同が起きやすいパターンを発見できます。
混同行列の活用
混同行列はモデルの弱点を特定するのに非常に有用です。例えば、特定のクラスで偽陰性が多い場合、そのクラスのデータ不足やクラス間の類似性が原因として考えられます。ヒートマップとして可視化することで、パターンをより直感的に把握できます。