Described Object Detection
Objekterkennung mit beschreibender Referenz (DOD) ist eine fortschrittliche Aufgabe im Bereich der Computer Vision, die darauf abzielt, alle Instanzen in einem Bild basierend auf flexiblen linguistischen Referenzen zu erkennen. DOD umfasst nicht nur die Fähigkeiten der offenen Vokabular-Objekterkennung (OVD), sondern erweitert sich auch auf flexible Ausdrücke von Kategorienamen und überwindet die Einschränkungen der sprachlichen Referenzverarbeitung (REC), die nur vorab gespeicherte Objekte lokalisieren kann. Dadurch erreicht DOD eine präzisere und umfassendere Objekterkennung und -lokalisation. Diese Technologie hat erheblichen Anwendungswert bei der Bildinterpretation und Szeneanalyse.