SHAPとは
SHAP(SHapley Additive exPlanations)とは、ゲーム理論のShapley値の概念を機械学習の予測説明に応用した手法です。2017年にLundbergとLeeによって提案され、各特徴量が個々の予測にどれだけ寄与しているかを、理論的に公正な方法で定量化します。
Shapley値の考え方
Shapley値はもともと協力ゲーム理論で、各プレイヤーの貢献を公正に配分するための概念です。SHAPでは、各特徴量を「プレイヤー」、予測値を「報酬」と見なし、すべての特徴量の組み合わせにおける各特徴量の限界的な貢献度を平均化することで、公正な寄与度を算出します。これにより、予測値が各特徴量のSHAP値の合計として分解されるという加法性の性質が保証されます。
SHAPの種類
計算効率を向上させるために、モデルに特化した複数の変種が開発されています。TreeSHAPは決定木ベースのモデル(勾配ブースティングなど)に対して高速に計算でき、DeepSHAPは深層学習モデルに対応し、KernelSHAPはモデル非依存型としてあらゆるモデルに適用可能です。
SHAPの利点と活用
SHAPの大きな利点は、Shapley値の理論的な裏付けにより、局所的な一貫性・欠落・対称性などの公理を満たすことです。各予測の説明(ウォーターフォールプロット)だけでなく、大域的な特徴量重要度やデータセット全体の依存関係も可視化できます。金融・医療・マーケティングなど幅広い分野で、モデルの解釈とバイアス検出の両方に活用されています。