HyperAI

Video Visual Relation Detection

Video-Visuelle Beziehungsidentifikation (VidVRD) ist ein Teilgebiet der Computer Vision, das darauf abzielt, Instanzen von visuellen Beziehungen von Interesse in Videos zu erkennen. Jede Instanz wird durch ein Beziehungstripel <Subjekt, Prädikat, Objekt> und dessen Trajektorie dargestellt. Im Vergleich zu statischen Bildern bieten Videos dynamische und zeitlich veränderliche Merkmale, die dazu beitragen, natürlichere visuelle Beziehungen zu erfassen. Aufgrund der hohen Genauigkeitsanforderungen für die Objektverfolgung und der Vielfalt der Beziehungsrepräsentationen ist VidVRD technisch anspruchsvoller als die Visuelle Beziehungsidentifikation in Bildern. Der Anwendungswert dieser Aufgabe liegt in ihrer Fähigkeit, den Videoinhalt tiefgründig zu verstehen und somit fortgeschrittene Szenenanalyse und Aktionserkennung zu unterstützen.