YOLOとは
YOLO(You Only Look Once)とは、リアルタイム物体検出を実現する代表的な1段階検出モデルです。2015年にJoseph Redmonらによって提案され、画像全体を一度の推論で処理して物体の位置とクラスを同時に予測する画期的なアプローチを導入しました。名前の通り「一度見るだけ」で検出が完了するため、処理速度が非常に高速です。
YOLOの進化
YOLOはv1からv11まで進化を続けています。YOLOv2はバッチ正規化やアンカーボックスを導入して精度を向上させました。YOLOv3はマルチスケール予測を採用し、様々なサイズの物体に対応しました。YOLOv4以降はCSPNet、PANet、各種のデータ拡張テクニックなどを取り入れ、精度と速度のバランスをさらに改善しています。YOLOv5以降はPyTorchベースとなり、使いやすさも向上しました。最新のバージョンではTransformer要素も取り込まれています。
YOLOの応用
YOLOは高速処理が求められる用途で特に重宝されています。自動運転のリアルタイム物体検出、産業用ロボットの視覚システム、監視カメラの映像解析、スポーツ中継での選手追跡、小売業での商品検出など、幅広い場面で利用されています。エッジデバイスでの推論にも対応するための軽量化も進んでいます。