GAN（敵対的生成ネットワーク）とは？わかりやすく解説

GANとは

GAN（Generative Adversarial Network、敵対的生成ネットワーク）は、2014年にイアン・グッドフェローによって提案された生成モデルです。生成器（Generator）と識別器（Discriminator）の2つのネットワークが互いに競い合いながら学習する「敵対的学習」の仕組みが特徴です。この画期的なアイデアにより、非常にリアルなデータの生成が可能になりました。

GANの学習メカニズム

生成器はランダムノイズから本物そっくりのデータを生成しようとし、識別器は入力が本物のデータか生成器が作った偽物かを見分けようとします。この2者のミニマックスゲームを通じて、生成器はますますリアルなデータを生成できるようになり、識別器はより精密な判別能力を獲得します。理論的には、学習が収束すると生成器の出力は本物のデータ分布と一致します。

GANの種類と発展

基本的なGANから、条件付きGAN（CGAN）、DCGAN（Deep Convolutional GAN）、StyleGAN、CycleGAN、Pix2Pixなど、多くの派生モデルが開発されました。StyleGANは高解像度の顔画像生成で驚異的な品質を達成し、CycleGANは対になるデータなしでの画像変換を可能にしました。

GANの課題と現在の位置づけ

GANの学習は不安定で、モード崩壊（生成器が多様性を失い限られたパターンしか生成しなくなる現象）が課題です。近年は拡散モデル（Diffusion Model）が画像生成の主流となりつつありますが、GANはリアルタイム生成や超解像など、高速な生成が求められる場面で依然として重要な技術です。

GANとは

GANの学習メカニズム

GANの種類と発展

GANの課題と現在の位置づけ

関連用語