脅威モデリング(AI)とは
AI向けの脅威モデリングとは、AIシステムに対する潜在的な脅威を体系的に特定・分析し、セキュリティ対策の優先順位を決定するプロセスです。従来のSTRIDEやDREADなどの脅威モデリング手法をAI特有のリスクに拡張したものです。
AIシステム特有の脅威
AIシステムでは、従来のITシステムに存在する脅威に加え、訓練データの汚染、敵対的入力による誤分類、モデルの窃取、プライバシー侵害など、AI固有の脅威が存在します。脅威モデリングでは、攻撃者の能力(ホワイトボックス・ブラックボックス)、攻撃のタイミング(訓練時・推論時)、攻撃の目的(妨害・情報窃取・不正利用)を軸に、包括的な脅威リストを作成します。
実施手順
AI脅威モデリングは、システムの資産棚卸し(モデル・データ・API)、攻撃面の特定、脅威の列挙、リスク評価、対策の立案という手順で進めます。MITREのATLASフレームワークは、AIに対する敵対的手法を体系化しており、脅威モデリングの参照資料として広く活用されています。定期的な見直しにより、新たな攻撃手法への対応力を維持することが重要です。