Faster R-CNN

Faster Region-based CNN

Faster R-CNNとは

Faster R-CNN(Faster Region-based Convolutional Neural Network)とは、2015年にShaoqing Renらによって提案された2段階物体検出モデルです。R-CNN、Fast R-CNNに続く進化版であり、Region Proposal Network(RPN)を導入することで、候補領域の生成と物体の分類・位置回帰を統一的なネットワークで実現しました。

Faster R-CNNのアーキテクチャ

Faster R-CNNは大きく2つのコンポーネントから構成されます。第1段階のRPNは、画像の特徴マップ上にアンカーボックスを配置し、物体が存在しそうな候補領域(Region Proposal)を生成します。第2段階では、生成された候補領域に対してROI PoolingやROI Alignを適用して特徴を抽出し、物体のクラス分類と位置の精密な回帰を行います。RPNと検出ネットワークが特徴マップを共有することで、効率的な処理が実現されています。

影響と発展

Faster R-CNNは2段階検出の代表的モデルとして、高い検出精度を実現しました。このフレームワークを基盤として、Mask R-CNN(インスタンスセグメンテーション)、Feature Pyramid Network(マルチスケール検出)など、多くの発展的手法が生まれました。処理速度では1段階モデルに劣りますが、精度を重視する用途では現在も広く使用されています。