Video Visual Relation Detection
La détection de relations visuelles dans les vidéos (VidVRD) est une sous-tâche dans le domaine de la vision par ordinateur visant à détecter des instances de relations visuelles d'intérêt dans les vidéos. Chaque instance est représentée par un triplet de relation <sujet, prédicat, objet> et sa trajectoire. Comparativement aux images statiques, les vidéos offrent des caractéristiques dynamiques et variables dans le temps, ce qui aide à capturer des relations visuelles plus naturelles. Cependant, en raison des exigences élevées en termes de suivi d'objets et de la diversité des représentations des relations, le VidVRD présente des défis techniques plus importants que la détection de relations visuelles dans les images. La valeur appliquée de cette tâche réside dans sa capacité à comprendre profondément le contenu des vidéos, soutenant ainsi une analyse de scène avancée et une reconnaissance d'actions.