HyperAIHyperAI

Command Palette

Search for a command to run...

Ensemble De Données De Reconnaissance De Lecture Labiale CAS-VSR-W1k

Discuter sur Discord

Date

il y a 3 ans

Organisation

URL de publication

vipl.ict.ac.cn

URL du document

arxiv.org

Licence

Non-Commercial

Featured Image

CAS-VSR-W1k, anciennement connu sous le nom de LRW-1000, est le plus grand ensemble de données de lecture labiale au niveau du vocabulaire mandarin disponible au public. L'ensemble de données contient 1 000 classes de mots et comprend 700 000 échantillons provenant de plus de 2 000 locuteurs. L'ensemble de données contient plus d'un million d'instances de caractères chinois.

Chaque catégorie correspond à une syllabe d'un mot mandarin composé d'un ou plusieurs caractères chinois. L'ensemble de données est conçu pour couvrir les variations naturelles dans différentes modalités de parole et conditions d'imagerie afin d'intégrer les défis rencontrés dans les applications du monde réel.

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp