Command Palette
Search for a command to run...
Ensemble De Données De Caractères Vidéo Multimodaux iQIYI-VID
Date
URL de publication
URL de l'article
Licence
Autre

iQIYI-VID est un ensemble de données de caractères vidéo multimodaux. L'ensemble de données contient 5 000 artistes célèbres et 500 000 clips vidéo totalisant 1 000 heures, chaque vidéo durant de 1 à 30 secondes. Les clips vidéo proviennent d'émissions de variétés, de films et de séries télévisées iQiyi. Chaque clip vidéo est annoté manuellement avec un taux d’erreur inférieur à 0,2 %. Les chercheurs ont évalué des modèles de pointe pour la reconnaissance faciale, la réidentification des personnes et la reconnaissance des locuteurs sur l'ensemble de données iQIYI-VID.
Construire l'IA avec l'IA
De l'idée au lancement — accélérez votre développement IA avec du co-codage IA gratuit, un environnement prêt à l'emploi et les meilleurs prix GPU.