バウンディングボックスとは？わかりやすく解説

バウンディングボックスとは

バウンディングボックス（Bounding Box）とは、物体検出において検出された物体を囲む最小の矩形（長方形）領域です。画像中の物体の位置を表現する最も基本的な方法であり、物体がどこにあるかを座標で示します。

表現形式と種類

バウンディングボックスの座標表現には主に2つの形式があります。一つは左上角と右下角の座標(x1, y1, x2, y2)で表す形式、もう一つは中心座標と幅・高さ(cx, cy, w, h)で表す形式です。物体検出モデルの種類によって使用される形式が異なります。また、水平な矩形だけでなく、回転したバウンディングボックス（Oriented Bounding Box）もあり、傾いた物体（衛星画像の船や車両など）の検出に使用されます。3Dバウンディングボックスは自動運転などで物体の3次元的な位置と大きさを表現するために使われます。

アノテーションとの関係

バウンディングボックスは機械学習の教師データ作成（アノテーション）において最も一般的なラベル付け方法です。ピクセルレベルのセグメンテーションマスクと比べて作成コストが低いため、大規模データセットの構築に適しています。ただし、物体の正確な輪郭を表現できないという限界があり、より精密な認識が必要な場合はセグメンテーションマスクが使用されます。バウンディングボックスの品質がモデルの学習精度に直結するため、正確なアノテーションが非常に重要です。