Generalized Referring Expression
Generalized Referring Expression Comprehension (GREC) ist eine fortgeschrittene Aufgabe im Bereich der Computer Vision, die darauf abzielt, die Korrespondenz zwischen natürlichsprachlichen Ausdrücken und mehreren Zielobjekten in Bildern zu behandeln. Diese Aufgabe ermittelt die Begrenzungsrahmen der Zielobjekte, indem sie ein Bild und einen referierenden Ausdruck als Eingabe verwendet, wodurch das Verständnis und die Interaktion mit komplexen Szenen verbessert wird. Der Anwendungswert von GREC besteht darin, die Natürlichkeit und Genauigkeit der Mensch-Computer-Interaktion zu erhöhen, und es findet breite Anwendung in intelligenten Assistenten, Bildsuche und Inhaltserstellungsszenarien.