第42問
ある小売店舗のPOS データからクーポンに対する反応予測モデルを作成して、 「反応」と予測される顧客グループにクーポンを配布したとすれば、検証データに対 して以下のような反応結果が得られるものとする。このとき、結果の解釈として最 も適切なものを下記の解答群から選べ。ただし、全顧客数は100 人であるとする。 100 30 70 合計 検証データ の反応結果 予測モデルによる予測 合計 60 40 10 30 未反応 反応 40 反応 20 未反応 U解答群W
- ア この予測結果の正答率;accuracyIは である。
- イ この予測結果の「反応」に対する再現率;recallIは である。
- ウ この予測結果の「反応」に対する精度;precisionIは である。
- エ この予測モデルで「反応」と予測された顧客にのみクーポンを配布したほう が、全顧客に配布するより反応効率がよい。 DKJC-1D
▼ 解答・解説を見る
正解:ア
解答:ア
予測モデルの的中度を測る指標を理解しているかを問う問題。全顧客100人について、予測(反応/未反応)と実際の反応結果(反応/未反応)をクロス集計した混同行列(分割表)を読み取る。混同行列は次のとおり整理できる。
- 「反応」と予測し実際も反応=真陽性(TP)=20人
- 「反応」と予測したが実際は未反応=偽陽性(FP)=10人(予測「反応」は合計30人)
- 「未反応」と予測したが実際は反応=偽陰性(FN)=40人
- 「未反応」と予測し実際も未反応=真陰性(TN)=30人(予測「未反応」は合計70人)
実際に反応した人は20+40=60人、未反応は10+30=40人。各指標は以下のとおり。
- ア(○):正答率(accuracy)=予測が当たった人数÷全体=(TP+TN)/100=(20+30)/100=0.5(50%)。記述の値と一致するため正しい。
- イ(×):再現率(recall)=TP/(TP+FN)=20/(20+40)=20/60≒0.33であり、記述の値とは異なる。
- ウ(×):精度(precision)=TP/(TP+FP)=20/(20+10)=20/30≒0.67であり、記述の値とは異なる。
- エ(×):「反応」と予測した30人のうち実際の反応は20人で反応率20/30≒67%。一方、全顧客では反応60人/100人=60%。確かに予測グループの反応率は高いが、本問の予測モデルは反応者60人のうち40人を取りこぼし(再現率が低い)、効率がよいとは一概に言えず、最も適切な解釈とはいえない。
よって ア。