Base De Données Vocales Chinoises AISHELL-2
Date
URL de publication
Licence
非商业用途
La durée de parole de la base de données de parole chinoise mandarine AISHELL-2 est de 1 000 heures, dont 718 heures proviennent de AISHELL-ASR0009-[ZH-CN] et 282 heures proviennent de AISHELL-ASR0010-[ZH-CN]. Les textes enregistrés couvrent 12 domaines, notamment les mots de réveil, les mots de commande vocale, la maison intelligente, la conduite sans pilote et la production industrielle. Le processus d'enregistrement a été réalisé dans un environnement intérieur calme, en utilisant simultanément trois appareils différents : un microphone haute fidélité (44,1 kHz, 16 bits) ; un téléphone Android (16 kHz, 16 bits) ; et un téléphone iOS (16 kHz, 16 bits). AISHELL-2 utilise des données vocales enregistrées par les téléphones iOS. 1 991 locuteurs de différentes régions d’accent en Chine ont participé à l’enregistrement. Après avoir été transcrit et annoté par des correcteurs vocaux professionnels et avoir passé un contrôle qualité strict, la précision du texte de cette base de données est supérieure à 96%. (Soutenir la recherche académique, l'utilisation commerciale est interdite sans autorisation)