Grounded Situation Recognition
La Reconnaissance de Situations Ancrées est une tâche dans le domaine de la vision par ordinateur qui vise à générer des résumés structurés d'images, décrivant les principales activités (verbes), les entités pertinentes (noms) et leurs emplacements de boîtes englobantes dans les images. Cette tâche fournit un soutien crucial pour la compréhension automatique des scènes, la recherche de contenu et la surveillance intelligente en identifiant et localisant précisément les éléments clés des images.