再現率(Recall)とは
再現率(Recall)とは、実際に陽性であるサンプルのうち、モデルが正しく陽性と予測できた割合を示す評価指標です。感度(Sensitivity)や真陽性率(True Positive Rate)とも呼ばれます。数式では TP /(TP + FN)で計算されます。
再現率が重要な場面
再現率が特に重要視されるのは、偽陰性(False Negative)のコストが高い場面です。医療診断では、病気の患者を「健康」と誤判定する見逃しは生命に関わるため、再現率を最大化することが求められます。不正検知においても、不正行為を見逃すことは大きな損失につながるため、高い再現率が必要です。
再現率と適合率のバランス
再現率を極端に高めようとすると、すべてのサンプルを陽性と予測すれば再現率100%を達成できますが、適合率は大幅に低下します。実用的には、タスクの要件に応じて適合率と再現率のバランスを適切に調整する必要があります。F値やFβスコアはこのバランスを定量化する指標です。
情報検索における再現率
情報検索の文脈では、再現率は関連する全文書のうち検索結果に含まれた割合を意味します。検索エンジンやドキュメント検索システムの評価において重要な指標であり、ユーザーが求める情報をどれだけ網羅できているかを測定します。