特徴量重要度とは
特徴量重要度(Feature Importance)とは、機械学習モデルの予測において各入力特徴量がどの程度影響を与えているかを定量的に評価する指標です。AI倫理の文脈では、モデルが保護属性(性別・人種など)を直接的または間接的に利用していないかを検証するための重要なツールとなっています。
特徴量重要度の算出方法
特徴量重要度の算出方法には複数のアプローチがあります。置換重要度(Permutation Importance)は、特定の特徴量の値をランダムにシャッフルし、予測性能の低下度合いで重要度を測ります。不純度ベースの重要度は決定木系モデルで用いられ、各特徴量による分岐がどれだけ不純度を減少させたかを評価します。SHAPやLIMEによる寄与度分析も特徴量重要度の一種です。
AI倫理における役割
特徴量重要度はバイアス検出において重要な役割を果たします。採用AIで「性別」の重要度が高い場合、差別的な判断が行われている可能性があります。直接的に保護属性を使用していなくても、その代理変数(例:郵便番号が人種の代理変数になるケース)の重要度を分析することで、間接的な差別を検出できます。
注意すべき点
特徴量重要度の解釈にはいくつかの注意点があります。特徴量間の相関が高い場合、重要度が不安定になることがあります。また、大域的な重要度(全体的な傾向)と局所的な重要度(個別の予測における影響)は異なる場合があります。公平性の評価においては、特徴量重要度だけでなく、公平性指標や因果関係の分析と組み合わせて総合的に判断することが求められます。