ペネトレーションテストとは
ペネトレーションテスト(AI)とは、AIシステムに対して実際の攻撃を模擬的に実行し、セキュリティ上の脆弱性を発見・評価するテスト手法です。従来のITシステムに対するペネトレーションテストの概念をAIシステムに適用したもので、AI特有の攻撃ベクトルを含む包括的なセキュリティ評価を行います。
AI特有のテスト項目
AIシステムに対するペネトレーションテストでは、従来のWebアプリケーションやネットワークのテストに加え、AI特有の項目が含まれます。敵対的サンプルへの耐性、プロンプトインジェクションの可否、モデル反転攻撃やメンバーシップ推定攻撃への脆弱性、訓練データの漏洩リスクなどが評価対象となります。
テストの実施プロセス
AIペネトレーションテストは通常、スコープ定義、情報収集、脆弱性分析、攻撃実行、報告書作成の5段階で実施されます。スコープ定義ではテスト対象のAIコンポーネントと攻撃シナリオを決定し、情報収集ではモデルの入出力インターフェースや利用可能なAPIを調査します。
フレームワークとツール
MITRE ATLASは、AIシステムに対する敵対的脅威のナレッジベースとして広く活用されています。また、Microsoft Counterfit、IBM Adversarial Robustness Toolbox(ART)、Garak(LLM専用)などのオープンソースツールが利用可能です。これらのツールを活用することで、体系的かつ効率的なペネトレーションテストの実施が可能となります。