交差検証(Cross-Validation)とは、モデルの汎化性能を評価するために、データセットを複数の部分に分割して繰り返し検証を行う手法です。限られたデータを最大限に活用し、モデル評価の信頼性を高めることができます。
k分割交差検証
最も一般的な交差検証の手法はk分割交差検証(k-Fold Cross-Validation)です。データセットをk個の等しいサイズに分割し、k-1個を訓練データ、残り1個を検証データとして使います。これをk回繰り返して各回の評価結果を平均することで、安定した性能評価を得ます。kは通常5または10が使われます。
その他の交差検証手法
Leave-One-Out交差検証(LOO-CV)、層化k分割交差検証(Stratified k-Fold)、時系列交差検証(Time Series Split)など、データの特性に応じた様々な変種があります。
ハイパーパラメータチューニングとの関連
交差検証はモデルの評価だけでなく、ハイパーパラメータチューニングにも活用されます。グリッドサーチやランダムサーチと組み合わせて使うことで、最適なハイパーパラメータを選択できます。