特徴量選択

Feature Selection

特徴量選択(Feature Selection)とは、モデルの入力として使う特徴量のうち、予測に有効なものだけを選び出す手法です。不要な特徴量を除くことで、モデルの性能向上、過学習の防止、学習時間の短縮が期待できます。

特徴量選択の手法

フィルタ法(相関係数やカイ二乗検定でスコアリング)、ラッパー法(前方選択や後方除去で最適な組み合わせを探索)、組み込み法(L1正則化やランダムフォレストの特徴量重要度で自動選択)の3つのアプローチがあります。

次元の呪いとの関連

特徴量が多すぎると「次元の呪い」により、モデルの性能が低下する場合があります。特徴量選択はこの問題を緩和する有効な手段です。