脅威モデリング(AI)とは？わかりやすく解説

脅威モデリング(AI)とは

AI向けの脅威モデリングとは、AIシステムに対する潜在的な脅威を体系的に特定・分析し、セキュリティ対策の優先順位を決定するプロセスです。従来のSTRIDEやDREADなどの脅威モデリング手法をAI特有のリスクに拡張したものです。

AIシステム特有の脅威

AIシステムでは、従来のITシステムに存在する脅威に加え、訓練データの汚染、敵対的入力による誤分類、モデルの窃取、プライバシー侵害など、AI固有の脅威が存在します。脅威モデリングでは、攻撃者の能力（ホワイトボックス・ブラックボックス）、攻撃のタイミング（訓練時・推論時）、攻撃の目的（妨害・情報窃取・不正利用）を軸に、包括的な脅威リストを作成します。

実施手順

AI脅威モデリングは、システムの資産棚卸し（モデル・データ・API）、攻撃面の特定、脅威の列挙、リスク評価、対策の立案という手順で進めます。MITREのATLASフレームワークは、AIに対する敵対的手法を体系化しており、脅威モデリングの参照資料として広く活用されています。定期的な見直しにより、新たな攻撃手法への対応力を維持することが重要です。

脅威モデリング(AI)とは

AIシステム特有の脅威

実施手順

関連用語