モデルの汎化(Model Generalization)とは、訓練データだけでなく、未知の新しいデータに対しても正確な予測ができるモデルの能力を指します。汎化性能の高いモデルを構築することが機械学習の最終的な目標です。
汎化誤差
汎化誤差は、未知のデータに対するモデルの予測誤差であり、バイアスとバリアンスに分解できます。テストデータでの性能が汎化誤差の推定値として使われます。
汎化性能を高める方法
適切な正則化(L1/L2、ドロップアウト、早期終了)、十分な訓練データの確保、データ拡張、交差検証によるモデル選択、アンサンブル学習の活用、転移学習の利用などが効果的です。
過学習と未学習のバランス
汎化性能は過学習と未学習のバランスで決まります。バイアス-バリアンストレードオフを理解し、適切な複雑さのモデルを選択することが重要です。