機械学習セキュリティ

Machine Learning Security

機械学習セキュリティとは

機械学習セキュリティとは、機械学習モデルおよびそのパイプラインに対するセキュリティ脅威を分析し、防御策を講じる専門分野です。従来のサイバーセキュリティとは異なり、学習データやモデルパラメータ自体が攻撃対象となる点が特徴です。

脅威の分類

機械学習システムへの脅威は大きく3つに分類されます。第一に、訓練段階でのデータ汚染やバックドア埋め込みといった訓練時攻撃があります。第二に、敵対的サンプルを用いた推論時の回避攻撃です。第三に、モデル抽出やメンバーシップ推定といったプライバシー攻撃があります。これらの攻撃はそれぞれ異なる防御手法を必要とします。

防御のアプローチ

機械学習セキュリティにおける防御は、ロバスト学習(敵対的訓練によるモデルの堅牢化)、データサニタイゼーション(訓練データの検証・浄化)、モデル監視(推論時の異常検知)の3層で構成されます。また、モデルの説明可能性を高めることで、攻撃を受けた際の検出能力が向上します。セキュリティ研究コミュニティでは、新しい攻撃手法と防御策の研究が活発に行われており、継続的な知識の更新が重要です。