Referring Expression Generation
Die Erzeugung von Bezugsausdrücken ist eine entscheidende Teilbereich im Bereich der Computer Vision. Sie zielt darauf ab, natürlichsprachliche Ausdrücke zu generieren, die spezifische Objekte innerhalb eines Bildes eindeutig identifizieren können. Das Ziel dieser Aufgabe besteht darin, präzise und charakteristische Beschreibungen durch die Integration visueller Informationen und sprachlicher Kenntnisse zu erstellen, um so die Objektreferenzierung in der Mensch-Computer-Interaktion zu erleichtern. Ihr Anwendungswert ist weitreichend und umfasst Szenarien wie erweiterte Realität, Bildannotierung und Roboternavigation, wodurch die Interaktivität und Benutzererfahrung von Systemen effektiv verbessert werden.