HyperAI

Referring Expression Segmentation

Referring Expression Segmentation (RES) zielt darauf ab, spezifische Objektinstanzen in Bildern oder Videos durch linguistische Ausdrücke auf Pixel-Ebene zu annotieren. Diese Aufgabe erfordert, dass der referierende Ausdruck (RE) das Zielobjekt in der Szene oder im Dialog eindeutig identifiziert, um die Genauigkeit und Einzigartigkeit der Annotation zu gewährleisten. Diese Technologie hat erheblichen Anwendungswert in der Mensch-Computer-Interaktion, Bildbearbeitung und Inhaltsverstehen.