経営情報システム R06年度 第23問

第23問

ある二値分類問題に対する2 つの予測モデルAとBに対して、1,000 件のデータ を用いて性能評価を行ったところ、以下の混同行列が得られた。  モデルAとBの性能評価に関する記述の正誤の組み合わせとして、最も適切なも のを下記の解答群から選べ。  ただし、正解率、適合率、再現率は、以下のように定義される。  ・正解率:全体の件数のうち、陽性と陰性を正しく予測した割合  ・適合率:陽性と予測した件数のうち、実際も陽性である割合  ・再現率:実際に陽性である件数のうち、陽性と予測した割合 a モデルAの正解率は、モデルBの正解率と等しい。 b モデルAの適合率は、モデルBの適合率よりも大きい。 c モデルAの再現率は、モデルBの再現率よりも大きい。

  1. a:正  b:正  c:正
  2. a:正  b:正  c:誤
  3. a:正  b:誤  c:正
  4. a:誤  b:正  c:正
  5. a:誤  b:誤  c:誤 モデルA モデルB 予測:陽性 予測:陰性 予測:陽性 予測:陰性 実際:陽性 実際:陽性 実際:陰性 実際:陰性
▼ 解答・解説を見る

正解:

解答:ウ

混同行列の値から、正解率=(TP+TN)÷全件、適合率=TP÷(TP+FP)、再現率=TP÷(TP+FN) を計算して比較する。

  • a(○):正解(陽性・陰性を正しく予測した)件数の合計が両モデルで等しく、全件数も1,000件で同じため、モデルAとBの正解率は等しい。正しい。
  • b(×):適合率(陽性と予測したうち実際も陽性の割合)を比較すると、モデルAはモデルBより大きくはならない。「Aの適合率がBより大きい」は誤り。
  • c(○):再現率(実際に陽性のうち陽性と予測できた割合)は、モデルAがモデルBより大きい。正しい。

正解率は同じでも、適合率と再現率にトレードオフの関係が表れているのが本問のポイント。よって a:正、b:誤、c:正 の

← 経営情報システムの一覧へ戻る