精度(Accuracy)とは
精度(Accuracy)とは、分類モデルの全予測のうち、正しく分類できた割合を示す評価指標です。最も直感的で理解しやすい指標であり、全サンプル数に対する正解数の比率として計算されます。数式では(TP + TN)/(TP + TN + FP + FN)で表されます。
精度の利点と限界
精度は計算が簡単で解釈が容易という利点がありますが、クラスの不均衡がある場合には誤解を招く可能性があります。例えば、全体の95%が正常データで5%が異常データというデータセットでは、すべてを「正常」と予測するだけで精度95%を達成できてしまいます。この場合、異常検知という本来の目的はまったく果たせていません。
精度が有効な場面
精度が有効に機能するのは、各クラスのサンプル数がほぼ均等で、偽陽性と偽陰性の重要度が同程度の場合です。例えば、画像認識における10クラス分類のように、各クラスの出現頻度が近いタスクでは精度が有用な指標となります。
不均衡データへの対応
クラス不均衡がある場合は、精度だけでなく適合率、再現率、F値、バランス精度(Balanced Accuracy)などの指標を併用することが重要です。バランス精度は各クラスの再現率の平均であり、不均衡データに対してより公平な評価を提供します。