異常検知(統計)

Anomaly Detection

異常検知(統計)とは

異常検知(Anomaly Detection)とは、データの中から通常のパターンから逸脱した異常なデータポイントやパターンを自動的に検出する手法です。統計的異常検知では、データの統計的性質に基づいて「正常」の範囲を定義し、その範囲外のデータを異常と判定します。

統計的手法による異常検知

基本的な手法として、Zスコア法(データが平均から何標準偏差離れているかで判定)、IQR法(四分位範囲の1.5倍を超える値を外れ値とする)、グラブス検定(最大の外れ値を統計的に検定)などがあります。これらは単変量の異常検知に適しています。

多変量の異常検知

複数の変数を同時に考慮する場合は、マハラノビス距離(多変量空間での距離指標)、ホテリングのT二乗統計量、Local Outlier Factor(LOF)、Isolation Forestなどが使用されます。高次元データでは、次元削減と組み合わせた手法が効果的です。

異常検知の応用

不正取引の検出、製造業における品質異常の検知、ITシステムの障害検出、医療における異常バイタルの検知、ネットワーク侵入検知など、多岐にわたる分野で活用されています。時系列データの異常検知では、季節性やトレンドを考慮したモデリングが必要です。