説明可能性(Explainability)とは
説明可能性(Explainability)とは、AIシステムがなぜ特定の出力や判断を行ったのかを、人間が理解できる形で説明できる性質を指します。ブラックボックスと呼ばれる複雑なAIモデルの内部動作を明らかにし、AIの信頼性と責任ある利用を支える重要な概念です。
説明可能性と解釈可能性の違い
説明可能性と解釈可能性(Interpretability)は関連しますが、異なる概念です。解釈可能性は、モデルの構造自体が人間にとって理解しやすいことを指し、説明可能性は、複雑なモデルであっても事後的に説明を生成できることを指します。決定木のような単純なモデルは本質的に解釈可能ですが、深層学習のような複雑なモデルでは、LIMEやSHAPなどの手法を用いて説明可能性を付与する必要があります。
説明の種類
説明にはさまざまな形態があります。特徴量の重要度を示すもの、類似した事例を提示するもの、反事実的説明(入力をどう変えれば結果が変わるか)を行うもの、ルールベースの説明を生成するものなどがあります。説明の対象者(専門家向けか一般ユーザー向けか)によっても、求められる説明の形態は異なります。
説明可能性の重要性
説明可能性は法的要件としても重視されています。EUのGDPRでは、自動化された意思決定に対する説明を受ける権利が規定されています。医療・金融・司法などの分野では、AIの判断根拠を示すことが信頼獲得と法令遵守の両面から求められています。