正則化(Regularization)とは、機械学習モデルの過学習を防ぐために、モデルの複雑さにペナルティを課す手法の総称です。損失関数に正則化項を追加することで、モデルが訓練データに過度に適合することを抑制します。
正則化の考え方
正則化の基本的な考え方は「オッカムの剃刀」に基づいています。同じ精度で予測できるなら、より単純なモデルの方が望ましいという原則です。正則化はモデルのパラメータの大きさを制限することで、モデルの複雑さを抑え、汎化性能を向上させます。
代表的な正則化手法
L1正則化(Lasso)はパラメータの絶対値の和をペナルティとして加え、不要なパラメータをゼロにすることで特徴量選択の効果があります。L2正則化(Ridge)はパラメータの二乗和をペナルティとして加え、パラメータ全体を小さく保ちます。Elastic Netは両者を組み合わせた手法です。
深層学習における正則化
深層学習では、ドロップアウト、バッチ正規化、データ拡張、重み減衰(Weight Decay)、早期終了なども正則化の手法として広く活用されています。これらを適切に組み合わせることで過学習を効果的に防ぐことができます。