学習曲線(Learning Curve)とは、モデルの訓練データと検証データに対する性能(精度や損失)を、学習の進行(エポック数やデータ量)に対してプロットしたグラフです。過学習・未学習の診断やデータ量の十分性の判断に活用されます。
エポック vs 性能の学習曲線
訓練損失が低いのに検証損失が高い場合は過学習を示します。両方の損失が高い場合は未学習です。訓練損失と検証損失が近い値で収束していれば良好な学習状態です。
データ量 vs 性能の学習曲線
訓練データ量を徐々に増やしてモデルの性能を評価します。訓練性能と検証性能の差が大きければデータを増やすことで改善が期待でき、両者が近い低い値で収束していればモデルの表現力不足です。