検証データ(Validation Data)とは、学習中のモデルの性能を監視し、ハイパーパラメータの調整やモデル選択に使用するデータです。訓練データとテストデータの間に位置する中間的な役割を果たします。
検証データの用途
学習中の過学習の検出(検証損失の監視)、ハイパーパラメータの比較・選択、早期終了のトリガー、モデルアーキテクチャの比較など、モデル開発のあらゆる段階で活用されます。
テストデータとの違い
検証データはモデル開発中に繰り返し使用されますが、テストデータは最終評価に1回だけ使用するものです。検証データに対して過度にチューニングすると、検証データにも過学習する可能性があるため、テストデータによる最終評価が不可欠です。