データ拡張(Data Augmentation)とは、既存の訓練データに変換を加えて新しいデータを生成し、データセットを人工的に拡大する手法です。特にデータが限られている場面で、モデルの汎化性能を向上させる効果があります。
画像データの拡張
回転、反転、スケーリング、クロッピング、色変換、ノイズ付加、Cutout、MixUp、CutMixなどが代表的です。深層学習の画像認識では標準的に使用されています。
テキストデータの拡張
同義語置換、ランダム挿入・削除・入れ替え、バックトランスレーション(他言語に翻訳して戻す)、LLMによる言い換え生成などの手法があります。
注意点
データの性質を変えてしまう不適切な拡張は逆効果です。例えば、数字認識で6を180度回転すると9になってしまいます。ドメイン知識に基づいた適切な拡張手法の選択が重要です。