Generalized Referring Expression
La Compréhension Généralisée des Expressions de Référence (GREC) est une tâche avancée dans le domaine de la vision par ordinateur visant à établir la correspondance entre les expressions de langage naturel et plusieurs objets cibles dans des images. Cette tâche prédit les boîtes englobantes des objets cibles en entrant une image et une expression de référence, permettant ainsi une compréhension et une interaction avec des scènes complexes. La valeur d'application du GREC réside dans l'amélioration de la naturalité et de la précision de l'interaction homme-machine, et il est largement utilisé dans les assistants intelligents, la recherche d'images et les scénarios d'édition de contenu.