F値(F1スコア)

F1 Score

F値(F1 Score)とは、適合率(Precision)と再現率(Recall)の調和平均で計算される評価指標です。F1 = 2×Precision×Recall/(Precision+Recall)で定義され、適合率と再現率のバランスを1つの数値で表現します。

なぜ調和平均か

算術平均ではなく調和平均を使う理由は、一方が極端に低い場合にF値も低くなるためです。例えば、Precision=1.0、Recall=0.01の場合、算術平均は0.505ですが、F値は0.02となり、バランスの悪さを適切に反映します。

Fβスコア

Fβスコアはβの値で適合率と再現率の重みを調整できます。β>1は再現率を重視(F2など)、β<1は適合率を重視(F0.5など)します。

マクロ平均とマイクロ平均

多クラス分類では、マクロ平均(各クラスのF値の平均)とマイクロ平均(全データをまとめて計算)の2種類があり、クラスの不均衡度に応じて使い分けます。