HyperAI

Ensemble De Données De Caractères Vidéo Multimodaux iQIYI-VID

Aide au téléchargement
特色图像

iQIYI-VID est un ensemble de données de caractères vidéo multimodaux. L'ensemble de données contient 5 000 artistes célèbres et 500 000 clips vidéo totalisant 1 000 heures, chaque vidéo durant de 1 à 30 secondes. Les clips vidéo proviennent d'émissions de variétés, de films et de séries télévisées iQiyi. Chaque clip vidéo est annoté manuellement avec un taux d’erreur inférieur à 0,2 %. Les chercheurs ont évalué des modèles de pointe pour la reconnaissance faciale, la réidentification des personnes et la reconnaissance des locuteurs sur l'ensemble de données iQIYI-VID.