MobileNetとは？わかりやすく解説

MobileNetとは

MobileNet（モバイルネット）は、2017年にGoogleが提案した軽量なCNNアーキテクチャです。モバイルデバイスや組み込みシステムなど、計算リソースが限られた環境での画像認識に特化して設計されています。Depthwise Separable Convolution（深さ方向分離畳み込み）を全面的に採用することで、高い精度を維持しながら計算量とパラメータ数を大幅に削減しています。

Depthwise Separable Convolution

MobileNetの核心技術であるDepthwise Separable Convolutionは、標準的な畳み込みをDepthwise Convolution（各チャネル独立の空間フィルタリング）とPointwise Convolution（1×1畳み込みによるチャネル間の統合）に分解します。この分解により、計算量が標準畳み込みの約1/8〜1/9に削減されます。

MobileNetのバージョン

MobileNet v1はDepthwise Separable Convolutionの基本構成を確立しました。MobileNet v2はInverted Residualブロック（薄いボトルネック間をSkip Connectionで結ぶ）とLinear Bottleneck（最後の活性化関数を除去）を導入しました。MobileNet v3ではNeural Architecture Search（NAS）で最適化されたアーキテクチャに、h-swish活性化関数やSqueeze-and-Excitation（SE）モジュールが組み込まれています。

MobileNetの活用場面

MobileNetはスマートフォンのカメラアプリ、AR（拡張現実）、自動運転の視覚システム、IoTデバイスなど、エッジAIの分野で広く活用されています。TensorFlow Liteなどのモバイル推論フレームワークとの親和性が高く、リアルタイムの画像認識を低消費電力で実現できます。