Grad-CAMとは？わかりやすく解説

Grad-CAMとは

Grad-CAM（Gradient-weighted Class Activation Mapping）とは、畳み込みニューラルネットワーク（CNN）が画像分類などのタスクでどの領域に注目して判断を行ったかを可視化する手法です。2017年にSelvarajuらによって提案され、AIの説明可能性を向上させる代表的な技術として広く利用されています。

Grad-CAMの仕組み

Grad-CAMは、特定のクラスに対する予測スコアの勾配を、CNNの最後の畳み込み層の特徴マップに対して計算します。この勾配を用いて各特徴マップの重要度を算出し、重み付き平均を取ることで、予測に重要な領域を示すヒートマップ（注目マップ）を生成します。赤い領域が予測に強く寄与した部分、青い領域が寄与しなかった部分を表します。

AI倫理における意義

Grad-CAMはAI倫理の観点から重要な役割を果たします。医療画像診断AIがレントゲン画像のどの部分に基づいて疾患を判断したかを医師に示すことで、AIへの信頼性が向上します。また、モデルが意図しない特徴（背景情報やアーティファクト）に基づいて判断していないかを検出するバイアス発見ツールとしても機能します。

Grad-CAMの発展

より高解像度の可視化を行うGrad-CAM++や、スムージングを加えたSmooth Grad-CAM++、Transformerベースのモデルに対応した手法など、さまざまな発展形が研究されています。視覚的な説明は非専門家にも理解しやすく、AIの社会実装における説明可能性の実現に大きく貢献しています。

Grad-CAMとは

Grad-CAMの仕組み

AI倫理における意義

Grad-CAMの発展

関連用語