HyperAIHyperAI

Command Palette

Search for a command to run...

Ensemble De Données De Caractères Vidéo Multimodaux iQIYI-VID

Discuter sur Discord

Date

il y a 3 ans

Organisation

URL de publication

challenge.ai.iqiyi.com

URL du document

arxiv.org

Licence

Other

Featured Image

iQIYI-VID est un ensemble de données de caractères vidéo multimodaux. L'ensemble de données contient 5 000 artistes célèbres et 500 000 clips vidéo totalisant 1 000 heures, chaque vidéo durant de 1 à 30 secondes. Les clips vidéo proviennent d'émissions de variétés, de films et de séries télévisées iQiyi. Chaque clip vidéo est annoté manuellement avec un taux d’erreur inférieur à 0,2 %. Les chercheurs ont évalué des modèles de pointe pour la reconnaissance faciale, la réidentification des personnes et la reconnaissance des locuteurs sur l'ensemble de données iQIYI-VID.

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp