FGSM

Fast Gradient Sign Method

FGSMとは

FGSM(Fast Gradient Sign Method)とは、2014年にIan Goodfellowらが提案した敵対的サンプルの生成手法です。損失関数の勾配の符号を利用して、一度の計算で効率的に敵対的摂動を生成できる点が特徴です。計算コストが低いため、大規模な敵対的訓練にも広く活用されています。

FGSMの仕組み

FGSMでは、まず入力データに対する損失関数の勾配を計算します。次に、その勾配の各要素の符号(正か負か)を取得し、これに小さな定数ε(イプシロン)を掛けた値を元の入力に加算します。この操作により、損失関数を最大化する方向に入力データを移動させ、モデルの誤分類を引き起こします。数式では x_adv = x + ε × sign(∇_x L(θ, x, y)) と表されます。

FGSMの特徴と限界

FGSMの最大の利点は計算効率の高さです。勾配計算と符号関数の適用だけで済むため、大量の敵対的サンプルを短時間で生成できます。一方で、一度のステップで摂動を決定するため、PGDなどの反復的手法と比較すると攻撃成功率が低い場合があります。

発展と応用

FGSMを起点として、I-FGSM(反復的FGSM)、MI-FGSM(モメンタム付きFGSM)、PGDなど多くの発展手法が提案されました。また、敵対的訓練の基礎としても重要な役割を果たしており、FGSMベースの敵対的訓練は計算効率と堅牢性のバランスに優れています。AI安全性の研究における基礎的なベンチマーク手法としても広く使われ続けています。