AISHELL-Salut, Mia Base De Données Vocale De Mots De Réveil Chinois Et Anglais
Date
URL de publication
Catégories
L'ensemble de données HI-MIA a été utilisé dans le défi de vérification des locuteurs AISHELL 2019.Il a été extrait d'une base de données plus grande appelée AISHELL-WakeUp-1.
L'ensemble de données est divisé en un ensemble de données HI-MIA et un ensemble d'entraînement, et le contenu est constitué des mots de réveil chinois et anglais « Hi, Mia ». Les données ont été collectées dans un environnement domestique réel à l’aide d’un réseau de microphones et d’un microphone Hi-Fi.Le papierLe processus de collecte et de développement du système de base sont décrits. Les données utilisées dans le défi ont été extraites d'un microphone Hi-Fi et d'un réseau de microphones circulaires à 16 canaux de 1/3/5 mètres. Le contenu est le mot d'éveil en chinois. L'ensemble est divisé en sous-ensembles train (254 personnes), dev (42 personnes) et test (44 personnes). Le sous-ensemble de test fournit des réponses cibles/non cibles appariées pour évaluer les résultats de validation.
La base de données vocales AISHELL-WakeUp-1 contient 3 936 003 voix de mots de réveil, totalisant 1 561,12 heures.Les langues d’enregistrement sont le chinois et l’anglais ; la région d'enregistrement est la Chine. Le texte d'enregistrement est le mot de réveil « salut, mia ». Cet ensemble de données a invité 254 locuteurs à participer à l'enregistrement. Le processus d'enregistrement a été réalisé dans un environnement domestique réel, avec 7 positions d'enregistrement configurées, en utilisant 6 cartes d'enregistrement de réseau de microphones PDM circulaires à 16 canaux pour la prise de parole lointaine (16 kHz, 16 bits) et 1 microphone haute fidélité pour la prise de parole proche (44,1 kHz, 16 bits). Cette base de données a été transcrite et annotée par des correcteurs vocaux professionnels et a passé des contrôles de qualité stricts, avec un taux de précision des mots de 100%. Il peut être utilisé pour la recherche sur la reconnaissance d'empreintes vocales, la reconnaissance de réveil vocal, etc.