GAN(敵対的生成ネットワーク)

Generative Adversarial Network

GANとは

GAN(Generative Adversarial Network、敵対的生成ネットワーク)は、2014年にイアン・グッドフェローによって提案された生成モデルです。生成器(Generator)と識別器(Discriminator)の2つのネットワークが互いに競い合いながら学習する「敵対的学習」の仕組みが特徴です。この画期的なアイデアにより、非常にリアルなデータの生成が可能になりました。

GANの学習メカニズム

生成器はランダムノイズから本物そっくりのデータを生成しようとし、識別器は入力が本物のデータか生成器が作った偽物かを見分けようとします。この2者のミニマックスゲームを通じて、生成器はますますリアルなデータを生成できるようになり、識別器はより精密な判別能力を獲得します。理論的には、学習が収束すると生成器の出力は本物のデータ分布と一致します。

GANの種類と発展

基本的なGANから、条件付きGAN(CGAN)、DCGAN(Deep Convolutional GAN)、StyleGAN、CycleGAN、Pix2Pixなど、多くの派生モデルが開発されました。StyleGANは高解像度の顔画像生成で驚異的な品質を達成し、CycleGANは対になるデータなしでの画像変換を可能にしました。

GANの課題と現在の位置づけ

GANの学習は不安定で、モード崩壊(生成器が多様性を失い限られたパターンしか生成しなくなる現象)が課題です。近年は拡散モデル(Diffusion Model)が画像生成の主流となりつつありますが、GANはリアルタイム生成や超解像など、高速な生成が求められる場面で依然として重要な技術です。