適合率(Precision)とは
適合率(Precision)とは、モデルが陽性(Positive)と予測したサンプルのうち、実際に陽性であったサンプルの割合を示す評価指標です。数式では TP /(TP + FP)で計算され、「予測の正確さ」を測る指標とも言えます。偽陽性(False Positive)が少ないほど適合率は高くなります。
適合率が重要な場面
適合率が特に重要視されるのは、偽陽性のコストが高い場面です。例えば、スパムメールフィルタでは、正常なメールをスパムと誤判定すると重要なメールを見逃す可能性があるため、適合率を高く保つことが求められます。また、レコメンデーションシステムでは、無関係な推薦はユーザー体験を損なうため適合率が重視されます。
再現率とのトレードオフ
適合率と再現率は一般的にトレードオフの関係にあります。分類閾値を上げると適合率は向上しますが再現率は低下し、閾値を下げると再現率は向上しますが適合率は低下します。このトレードオフを可視化するのがPR曲線(Precision-Recall Curve)です。
多クラス分類での適合率
多クラス分類では、各クラスごとの適合率を計算し、マクロ平均やマイクロ平均、加重平均で集約します。クラスの重要度や出現頻度に応じて適切な集約方法を選択することが大切です。