Ensemble De Données De Caractères Vidéo Multimodaux iQIYI-VID
Date
il y a 3 ans
URL de publication
Licence
其他
Catégories

iQIYI-VID est un ensemble de données de caractères vidéo multimodaux. L'ensemble de données contient 5 000 artistes célèbres et 500 000 clips vidéo totalisant 1 000 heures, chaque vidéo durant de 1 à 30 secondes. Les clips vidéo proviennent d'émissions de variétés, de films et de séries télévisées iQiyi. Chaque clip vidéo est annoté manuellement avec un taux d’erreur inférieur à 0,2 %. Les chercheurs ont évalué des modèles de pointe pour la reconnaissance faciale, la réidentification des personnes et la reconnaissance des locuteurs sur l'ensemble de données iQIYI-VID.