第23問
ある二値分類問題に対する2 つの予測モデルAとBに対して、1,000 件のデータ を用いて性能評価を行ったところ、以下の混同行列が得られた。 モデルAとBの性能評価に関する記述の正誤の組み合わせとして、最も適切なも のを下記の解答群から選べ。 ただし、正解率、適合率、再現率は、以下のように定義される。 ・正解率:全体の件数のうち、陽性と陰性を正しく予測した割合 ・適合率:陽性と予測した件数のうち、実際も陽性である割合 ・再現率:実際に陽性である件数のうち、陽性と予測した割合 a モデルAの正解率は、モデルBの正解率と等しい。 b モデルAの適合率は、モデルBの適合率よりも大きい。 c モデルAの再現率は、モデルBの再現率よりも大きい。
- ア a:正 b:正 c:正
- イ a:正 b:正 c:誤
- ウ a:正 b:誤 c:正
- エ a:誤 b:正 c:正
- オ a:誤 b:誤 c:誤 モデルA モデルB 予測:陽性 予測:陰性 予測:陽性 予測:陰性 実際:陽性 実際:陽性 実際:陰性 実際:陰性
▼ 解答・解説を見る
正解:ウ
解答:ウ
混同行列の値から、正解率=(TP+TN)÷全件、適合率=TP÷(TP+FP)、再現率=TP÷(TP+FN) を計算して比較する。
- a(○):正解(陽性・陰性を正しく予測した)件数の合計が両モデルで等しく、全件数も1,000件で同じため、モデルAとBの正解率は等しい。正しい。
- b(×):適合率(陽性と予測したうち実際も陽性の割合)を比較すると、モデルAはモデルBより大きくはならない。「Aの適合率がBより大きい」は誤り。
- c(○):再現率(実際に陽性のうち陽性と予測できた割合)は、モデルAがモデルBより大きい。正しい。
正解率は同じでも、適合率と再現率にトレードオフの関係が表れているのが本問のポイント。よって a:正、b:誤、c:正 の ウ。