Ensemble De Données Vidéo De Mise À La Terre À Grande Échelle VidSTG
Date
il y a 3 ans
URL de publication
Licence
其他
Catégories

L'ensemble de données VidSTG est un ensemble de données de mise à la terre vidéo spatio-temporelle construit sur la base de l'ensemble de données VidOR. VidOR est un ensemble de données de relations vidéo contenant respectivement 7 000, 835 et 2 165 vidéos pour la formation, la validation et les tests. L'objectif de la tâche Spatio-Temporal Video Grounding est de localiser les parties spatio-temporelles d'une vidéo non découpée qui correspondent à une phrase donnée décrivant une cible.