Base De Données Vocales Chinoises Open Source AISHELL-1
Date
Taille
URL de publication
La base de données vocales open source Hillshell chinois mandarin AISHELL-ASR0009-OS1 a une durée d'enregistrement de 178 heures et fait partie de la base de données vocales Hillshell chinois mandarin AISHELL-ASR0009.
Le texte d'enregistrement AISHELL-ASR0009 couvre 11 domaines, notamment la maison intelligente, la conduite sans pilote, la production industrielle, etc. Le processus d'enregistrement a été réalisé dans un environnement intérieur calme, en utilisant simultanément trois appareils différents : un microphone haute fidélité (44,1 kHz, 16 bits) ; un téléphone Android (16 kHz, 16 bits) ; et un téléphone iOS (16 kHz, 16 bits). L'audio enregistré avec un microphone haute fidélité a été sous-échantillonné à 16 kHz pour l'AISHELL-ASR0009-OS1. L'enregistrement a été réalisé par 400 locuteurs de différentes régions d'accent en Chine. Après avoir été transcrit et annoté par des correcteurs vocaux professionnels et avoir passé un contrôle qualité strict, la précision du texte de cette base de données est supérieure à 95%. Il est divisé en ensemble d'entraînement, ensemble de développement et ensemble de test.