バウンディング ボックスは、バウンディング ボリュームまたはバウンディング エリアとも呼ばれ、画像内のターゲットの位置と範囲を記述するために使用される長方形のボックスです。これは、長方形のフレームの左上隅と右下隅の座標によって定義され、ターゲット オブジェクトをマークし、位置を特定するために使用できます。オブジェクト検出タスクでは、モデルはターゲット オブジェクトの境界ボックスを予測することでオブジェクトの検出と位置特定を実現します。バウンディング ボックスの目的は、2D または 3D 空間内のオブジェクトの位置とサイズを定義し、オブジェクトの操作と分析を容易にすることです。
2D 画像の境界ボックスは通常、長辺が画像の x 軸と y 軸に平行な長方形で表されます。 x 軸と y 軸の最小値と最大値 (長方形の角の座標によって指定される) によって、長方形のサイズが決まります。長方形のサイズと中心点を使用して、囲むボックスを作成することもできます。
3D 画像の境界ボックスは通常、画像の x、y、z 軸に平行な辺を持つ平行六面体 (3D 長方形) で表されます。直方体の角の座標は、その寸法を決定する x、y、z 軸の最小値と最大値を表します。直方体のサイズと中心を使用して境界ボックスを決定することもできます。
コンピューター ビジョン、画像処理、ロボット工学などの多くのアプリケーションでは、境界ボックスが使用されます。境界ボックスは、コンピューター ビジョンで画像やビデオ内のアイテムを識別および分類するために使用されます。たとえば、境界ボックスを使用して、写真内の人物を識別したり、写真内のオブジェクト (車、椅子など) を分類したりできます。
境界ボックスは、画像内のオブジェクトのトリミング、サイズ変更、回転を行うために画像処理で使用されます。たとえば、境界ボックスを使用して、構造物や顔の写真を回転またはトリミングすることができます。
境界ボックスには、デジタル画像内のオブジェクトを定義する他の方法に比べて、いくつかの利点があります。: