特徴ピラミッドネットワーク(FPN)

Feature Pyramid Network

特徴ピラミッドネットワーク(FPN)とは

特徴ピラミッドネットワーク(Feature Pyramid Network:FPN)とは、画像中の異なるサイズの物体を効果的に検出するための特徴抽出アーキテクチャです。2017年にTsung-Yi Linらによって提案され、CNNの各層から得られるマルチスケールの特徴マップを効率的に統合します。

FPNの構造

FPNはボトムアップパスウェイ、トップダウンパスウェイ、ラテラル接続の3つの要素から構成されます。ボトムアップパスウェイは通常のCNN(ResNetなど)のフォワードパスで、画像から階層的な特徴を抽出します。トップダウンパスウェイは、最上位の意味的に豊かな特徴マップをアップサンプリングして低レベル層に戻します。ラテラル接続は、ボトムアップの特徴マップとトップダウンの特徴マップを1x1畳み込みで結合します。これにより、すべてのスケールで「空間的に詳細」かつ「意味的に豊か」な特徴マップが得られます。

影響と応用

FPNは物体検出における根本的な課題、すなわち小さな物体の検出精度の低さを大きく改善しました。Faster R-CNN、RetinaNet、Mask R-CNNなど、多くの検出・セグメンテーションモデルのバックボーンとして採用されています。FPNの概念を発展させたPANet、NAS-FPN、BiFPNなどの派生手法も提案されており、マルチスケール特徴融合は現代の物体検出に不可欠な要素となっています。