DeepLabとは
DeepLab(ディープラボ)とは、Google Researchが開発したセマンティックセグメンテーションのモデルシリーズです。DeepLabv1からDeepLabv3+まで進化を重ね、Atrous Convolution(Dilated Convolution)を活用して高精度なピクセルレベルの画像セグメンテーションを実現しました。
DeepLabの主要技術
DeepLabシリーズの核心技術はAtrous Convolution(空洞畳み込み)です。通常の畳み込みフィルタに「穴」を開けることで、パラメータ数を増やさずに受容野を拡大できます。DeepLabv2ではASPP(Atrous Spatial Pyramid Pooling)を導入し、異なるレートのAtrous Convolutionを並列適用して多スケールの文脈情報を取得します。DeepLabv3ではASPPをさらに改良し、グローバル平均プーリングも統合しました。DeepLabv3+ではエンコーダ・デコーダ構造を採用し、セグメンテーション境界の精度を大幅に向上させています。
DeepLabの応用と意義
DeepLabは自動運転のシーン理解、医療画像のセグメンテーション、衛星画像解析、AR/VRの背景分離など、高精度なセグメンテーションが求められる場面で広く利用されています。CRF(Conditional Random Field)による後処理でセグメンテーション境界を洗練させる手法も特徴的です。DeepLabの設計思想は後続の多くのセグメンテーションモデルに影響を与えました。