COCOとは
COCO(Common Objects in Context)とは、物体検出、セグメンテーション、キャプショニングなどのコンピュータビジョンタスクのための大規模ベンチマークデータセットです。Microsoftにより2014年に公開され、日常的な場面の画像に対して詳細なアノテーション(注釈)が付与されています。
COCOの構成
COCOデータセットは33万枚以上の画像と250万以上のラベル付きインスタンスで構成されています。80のオブジェクトカテゴリの物体検出、インスタンスセグメンテーション、パノプティックセグメンテーション、キーポイント検出、画像キャプショニングなど、多様なタスクに対応しています。
COCOの評価指標
物体検出タスクではmAP(mean Average Precision)が主要な評価指標です。IoU(Intersection over Union)の閾値を変化させた平均APや、小・中・大オブジェクト別のAPなど、詳細な評価が可能です。セグメンテーションタスクではマスクのmAPが使われます。
COCOの影響
COCOはコンピュータビジョン研究の標準ベンチマークとして不動の地位を確立しています。YOLO、Faster R-CNN、Mask R-CNN、DETRなど、物体検出の主要なアーキテクチャはすべてCOCOでの性能が報告されています。年次のCOCOチャレンジは最先端技術の発展を促進しています。