ImageNet（ベンチマーク）とは？わかりやすく解説

ImageNetとは

ImageNet とは、画像認識の研究と評価のための大規模画像データベースおよびベンチマークです。スタンフォード大学のFei-Fei Liらにより2009年に公開され、約1,400万枚の画像が21,841カテゴリに分類されています。特にImageNet Large Scale Visual Recognition Challenge（ILSVRC）は、コンピュータビジョンの発展を大きく推進しました。

ILSVRCの歴史的意義

ILSVRCは2010年から2017年まで毎年開催された画像分類コンペティションです。1,000カテゴリの画像分類タスクで、2012年にAlexNetが深層学習を用いて圧倒的な精度で優勝したことが、ディープラーニング革命の引き金となりました。その後、VGGNet、GoogLeNet、ResNetなどの画期的なアーキテクチャが次々と登場しました。

ベンチマークとしてのImageNet

ImageNetの1,000クラス分類タスクは、画像認識モデルの標準的なベンチマークとして定着しています。Top-1精度（最も確率の高い予測が正解である割合）とTop-5精度（上位5つの予測に正解が含まれる割合）が主な評価指標です。最新モデルではTop-1精度が90%を超えています。

ImageNetの課題と意義

ImageNetにはラベルの誤りやバイアスの問題が指摘されています。しかし、深層学習の実用性を実証し、コンピュータビジョン全体の発展を牽引した功績は計り知れません。現在でも事前学習モデルの基盤として広く使用されています。

ImageNetとは

ILSVRCの歴史的意義

ベンチマークとしてのImageNet

ImageNetの課題と意義

関連用語