F値

F-score / F-measure

F値とは

F値(F-score、F-measure)とは、適合率(Precision)と再現率(Recall)の調和平均として計算される評価指標です。適合率と再現率のバランスを一つの数値で表現でき、特にクラス不均衡のある分類タスクで広く使用されます。F1スコアが最も一般的で、適合率と再現率を等しく重視します。

F1スコアの計算

F1スコアは 2 * Precision * Recall /(Precision + Recall)で計算されます。調和平均を用いるため、適合率と再現率のどちらか一方が極端に低い場合、F1スコアも低い値となります。これにより、両方の指標のバランスが取れたモデルが高く評価されます。

Fβスコア

F値にはFβスコアという一般化された形式があります。βの値によって適合率と再現率の重み付けを変えることができます。β > 1の場合は再現率を重視し(例:F2スコアは再現率を2倍重視)、β < 1の場合は適合率を重視します(例:F0.5スコアは適合率を2倍重視)。タスクの要件に応じてβの値を調整します。

F値の活用場面

F値は自然言語処理の固有表現認識、テキスト分類、情報抽出など幅広い分野で標準的な評価指標として使われています。学術論文やコンペティションでもF1スコアが報告されることが多く、モデルの比較に不可欠な指標です。