Inception

Inception

Inceptionとは

Inception(インセプション)は、2014年にGoogleの研究チームが提案したCNNアーキテクチャで、「GoogLeNet」としてILSVRC 2014で優勝しました。映画「インセプション」にちなんで名付けられたこのモデルの最大の特徴は、複数サイズのフィルタを並列に適用するInceptionモジュールにあります。

Inceptionモジュール

Inceptionモジュールは、1×1、3×3、5×5の異なるサイズの畳み込みフィルタと3×3のMaxプーリングを並列に実行し、その結果をチャネル方向に結合します。これにより、異なるスケールの特徴を同時に捉えることができます。1×1畳み込みをボトルネック構造として使用し、計算量を大幅に削減しているのも重要な工夫です。

Inceptionの進化

初代のGoogLeNet(Inception v1)から、Inception v2/v3(大きなフィルタを小さなフィルタの組み合わせに分解)、Inception v4(残差結合の導入)、Inception-ResNet(InceptionとResNetの融合)と段階的に改良されてきました。これらの改良により、精度と計算効率の両方が向上しています。

Inceptionの設計思想の影響

Inceptionの「異なるスケールの特徴を並列に抽出する」という設計思想は、後続の多くのアーキテクチャに影響を与えました。マルチスケール特徴抽出の考え方はFPN(Feature Pyramid Network)やEfficientNetにも取り入れられています。また、計算コストを意識したアーキテクチャ設計のパイオニアとしても重要な位置を占めています。