AISHELL-Hi, Mia Chinesische Und Englische Weckwort-Sprachdatenbank
Datum
Veröffentlichungs-URL
Tags
Kategorien
Der HI-MIA-Datensatz wurde bei der AISHELL Speaker Verification Challenge 2019 verwendet.Es wurde aus einer größeren Datenbank namens AISHELL-WakeUp-1 extrahiert.
Der Datensatz ist in einen HI-MIA-Datensatz und einen Trainingssatz unterteilt und der Inhalt besteht aus den chinesischen und englischen Weckwörtern „Hi, Mia“. Die Daten wurden in einer realen Wohnumgebung mithilfe eines Mikrofon-Arrays und eines Hi-Fi-Mikrofons erfasst.Das PapierDer Prozess und die Entwicklung des Basissystem-Erfassungssystems werden beschrieben. Die in der Challenge verwendeten Daten wurden aus 1 Hi-Fi-Mikrofon und einem 16-Kanal-Rundmikrofon-Array von 1/3/5 Metern extrahiert. Der Inhalt ist das Weckwort auf Chinesisch. Der gesamte Satz ist in die Teilsätze Train (254 Personen), Dev (42 Personen) und Test (44 Personen) unterteilt. Die Testteilmenge bietet gepaarte Ziel-/Nichtzielantworten zur Auswertung der Validierungsergebnisse.
Die AISHELL-WakeUp-1-Sprachdatenbank enthält 3.936.003 Weckwortstimmen mit einer Gesamtdauer von 1561,12 Stunden.Die Aufnahmesprachen sind Chinesisch und Englisch; die Aufnahmeregion ist China. Der Aufnahmetext ist das Weckwort „hi, mia“. Dieser Datensatz lud 254 Sprecher ein, an der Aufzeichnung teilzunehmen. Der Aufnahmevorgang wurde in einer realen Wohnumgebung mit 7 eingerichteten Aufnahmepositionen durchgeführt, wobei 6 kreisförmige 16-Kanal-PDM-Mikrofon-Array-Aufnahmekarten für die Aufnahme von Ferngesprächen (16 kHz, 16 Bit) und 1 Hi-Fi-Mikrofon für die Aufnahme von Nahgesprächen (44,1 kHz, 16 Bit) verwendet wurden. Diese Datenbank wurde von professionellen Stimmkorrektoren transkribiert und kommentiert und hat strenge Qualitätskontrollen mit einer Wortgenauigkeit von 100% bestanden. Es kann für die Forschung zur Stimmabdruckerkennung, Sprachweckerkennung usw. verwendet werden.