COCOとは？わかりやすく解説

COCOとは

COCO（Common Objects in Context）とは、物体検出、セグメンテーション、キャプショニングなどのコンピュータビジョンタスクのための大規模ベンチマークデータセットです。Microsoftにより2014年に公開され、日常的な場面の画像に対して詳細なアノテーション（注釈）が付与されています。

COCOの構成

COCOデータセットは33万枚以上の画像と250万以上のラベル付きインスタンスで構成されています。80のオブジェクトカテゴリの物体検出、インスタンスセグメンテーション、パノプティックセグメンテーション、キーポイント検出、画像キャプショニングなど、多様なタスクに対応しています。

COCOの評価指標

物体検出タスクではmAP（mean Average Precision）が主要な評価指標です。IoU（Intersection over Union）の閾値を変化させた平均APや、小・中・大オブジェクト別のAPなど、詳細な評価が可能です。セグメンテーションタスクではマスクのmAPが使われます。

COCOの影響

COCOはコンピュータビジョン研究の標準ベンチマークとして不動の地位を確立しています。YOLO、Faster R-CNN、Mask R-CNN、DETRなど、物体検出の主要なアーキテクチャはすべてCOCOでの性能が報告されています。年次のCOCOチャレンジは最先端技術の発展を促進しています。

COCOとは

COCOの構成

COCOの評価指標

COCOの影響

関連用語