HyperAI

Generalized Referring Expression Segmentation

La Segmentation de Phrases Référentielles Généralisée (GRES) est une tâche en vision par ordinateur introduite par Liu et al. lors de la conférence CVPR 2023. L'objectif de cette tâche est de gérer la correspondance entre les expressions en langage naturel et plusieurs objets cibles dans des images, en prédissant les masques des objets cibles à partir d'une image et d'une phrase référentielle. La valeur d'application de la GRES réside dans l'amélioration de la naturalité et de la précision de l'interaction homme-machine, notamment dans la reconnaissance et la segmentation d'objets multiples dans des scènes complexes.