MobileNet

MobileNet

MobileNetとは

MobileNet(モバイルネット)は、2017年にGoogleが提案した軽量なCNNアーキテクチャです。モバイルデバイスや組み込みシステムなど、計算リソースが限られた環境での画像認識に特化して設計されています。Depthwise Separable Convolution(深さ方向分離畳み込み)を全面的に採用することで、高い精度を維持しながら計算量とパラメータ数を大幅に削減しています。

Depthwise Separable Convolution

MobileNetの核心技術であるDepthwise Separable Convolutionは、標準的な畳み込みをDepthwise Convolution(各チャネル独立の空間フィルタリング)とPointwise Convolution(1×1畳み込みによるチャネル間の統合)に分解します。この分解により、計算量が標準畳み込みの約1/8〜1/9に削減されます。

MobileNetのバージョン

MobileNet v1はDepthwise Separable Convolutionの基本構成を確立しました。MobileNet v2はInverted Residualブロック(薄いボトルネック間をSkip Connectionで結ぶ)とLinear Bottleneck(最後の活性化関数を除去)を導入しました。MobileNet v3ではNeural Architecture Search(NAS)で最適化されたアーキテクチャに、h-swish活性化関数やSqueeze-and-Excitation(SE)モジュールが組み込まれています。

MobileNetの活用場面

MobileNetはスマートフォンのカメラアプリ、AR(拡張現実)、自動運転の視覚システム、IoTデバイスなど、エッジAIの分野で広く活用されています。TensorFlow Liteなどのモバイル推論フレームワークとの親和性が高く、リアルタイムの画像認識を低消費電力で実現できます。