HyperAI

La boîte englobante, également connue sous le nom de volume englobant ou de zone englobante, est une boîte rectangulaire utilisée pour décrire l'emplacement et la portée d'un objet dans une image.Il est défini par les coordonnées des coins supérieur gauche et inférieur droit de la boîte rectangulaire et peut être utilisé pour marquer et localiser l'objet cible. Dans la tâche de détection d'objet, le modèle réalise la détection et la localisation d'objet en prédisant la boîte englobante de l'objet cible. Le but d'une boîte englobante est de définir l'emplacement et la taille d'un objet dans un espace 2D ou 3D et de faciliter la manipulation et l'analyse de l'objet.

Les cadres de délimitation dans les images 2D sont généralement représentés par des rectangles dont les côtés longs sont parallèles aux axes x et y de l'image. Les valeurs minimales et maximales des axes x et y (spécifiées par les coordonnées des coins du rectangle) déterminent la taille du rectangle. La taille et le point central du rectangle peuvent également être utilisés pour créer une boîte englobante.

Un cadre de délimitation dans une image 3D est généralement représenté par un parallélépipède (rectangle 3D) dont les côtés sont parallèles aux axes x, y et z de l'image. Les coordonnées des points d'angle du parallélépipède représentent les valeurs minimales et maximales des axes x, y et z, déterminant sa taille. La taille et le centre du parallélépipède peuvent également être utilisés pour déterminer la boîte englobante.

Boîtes englobantes en vision par ordinateur

De nombreuses applications, telles que la vision par ordinateur, le traitement d’images et la robotique, utilisent des boîtes englobantes. Les cadres de délimitation sont utilisés en vision par ordinateur pour identifier et classer les éléments dans les images et les vidéos. Par exemple, les cadres de délimitation peuvent être utilisés pour identifier des personnes dans une image ou pour classer des objets dans une image (par exemple, des voitures, des chaises, etc.).

Les cadres de délimitation sont utilisés dans le traitement d'images pour recadrer, redimensionner et faire pivoter les objets dans les images. Par exemple, les cadres de délimitation peuvent être utilisés pour faire pivoter ou recadrer des images de structures ou de faces.

Les cadres de délimitation présentent plusieurs avantages par rapport aux autres méthodes de définition d’objets dans les images numériques.:

Ils sont faciles à mettre en œuvre et à comprendre ;
Efficaces en termes de calcul, car ils ne nécessitent que les coordonnées des coins ou des points centraux et la taille de la boîte englobante ;
Solides et durables car ils peuvent manipuler des objets de différentes formes et tailles.

Références

【1】https://encord.com/glossary/bounding-box-definition/

Cadre De Délimitation

Boîtes englobantes en vision par ordinateur

Références