Base De Données Vocale AISHELL-DMASH Pour Microphones Chinois Mandarin
Date
URL de publication
L'ensemble de données AISHELL-DMASH a été enregistré dans des scénarios réels de maison intelligente dans deux pièces différentes et contient 30 000 heures de données vocales.L'équipement d'enregistrement était composé d'un microphone à courte portée et de 7 ensembles d'équipements situés à 7 endroits différents de la pièce. Un ensemble d'équipements d'enregistrement comprend un iPhone, un téléphone Android, un iPad, un microphone et un réseau de microphones circulaires d'un rayon de 5 cm. L'ensemble de données contient 511 locuteurs, chacun d'entre eux ayant été visité 3 fois avec un intervalle de 7 à 15 jours. L'ensemble de données AISHELL-DMASH est transcrit par des annotateurs vocaux professionnels avec une précision de mot de 98%. Il peut être utilisé pour des recherches telles que la reconnaissance d'empreintes vocales, la reconnaissance vocale et la reconnaissance de mots d'éveil.