ImageNetとは
ImageNet とは、画像認識の研究と評価のための大規模画像データベースおよびベンチマークです。スタンフォード大学のFei-Fei Liらにより2009年に公開され、約1,400万枚の画像が21,841カテゴリに分類されています。特にImageNet Large Scale Visual Recognition Challenge(ILSVRC)は、コンピュータビジョンの発展を大きく推進しました。
ILSVRCの歴史的意義
ILSVRCは2010年から2017年まで毎年開催された画像分類コンペティションです。1,000カテゴリの画像分類タスクで、2012年にAlexNetが深層学習を用いて圧倒的な精度で優勝したことが、ディープラーニング革命の引き金となりました。その後、VGGNet、GoogLeNet、ResNetなどの画期的なアーキテクチャが次々と登場しました。
ベンチマークとしてのImageNet
ImageNetの1,000クラス分類タスクは、画像認識モデルの標準的なベンチマークとして定着しています。Top-1精度(最も確率の高い予測が正解である割合)とTop-5精度(上位5つの予測に正解が含まれる割合)が主な評価指標です。最新モデルではTop-1精度が90%を超えています。
ImageNetの課題と意義
ImageNetにはラベルの誤りやバイアスの問題が指摘されています。しかし、深層学習の実用性を実証し、コンピュータビジョン全体の発展を牽引した功績は計り知れません。現在でも事前学習モデルの基盤として広く使用されています。