AISHELL-1 Open Source-Datenbank Für Chinesische Sprache
Datum
Größe
Veröffentlichungs-URL
Tags
Kategorien
Die Hillshell-Open-Source-Sprachdatenbank „Chinesisch Mandarin“ AISHELL-ASR0009-OS1 hat eine Aufnahmezeit von 178 Stunden und ist Teil der Hillshell-Sprachdatenbank „Chinesisch Mandarin“ AISHELL-ASR0009.
Der Aufnahmetext AISHELL-ASR0009 deckt 11 Bereiche ab, darunter Smart Home, unbemanntes Fahren, industrielle Produktion usw. Der Aufnahmevorgang wurde in einer ruhigen Innenumgebung durchgeführt, wobei drei verschiedene Geräte gleichzeitig verwendet wurden: ein Hi-Fi-Mikrofon (44,1 kHz, 16 Bit); ein Android-Telefon (16 kHz, 16 Bit); und ein iOS-Telefon (16 kHz, 16 Bit). Für das AISHELL-ASR0009-OS1 wurde mit einem Hi-Fi-Mikrofon aufgenommenes Audio auf 16 kHz heruntergesampelt. Die Aufnahme wurde von 400 Sprechern aus verschiedenen Akzentregionen Chinas durchgeführt. Nach der Transkription und Kommentierung durch professionelle Stimmkorrektoren und einer strengen Qualitätskontrolle liegt die Textgenauigkeit dieser Datenbank über 95%. Es ist in Trainingssatz, Entwicklungssatz und Testsatz unterteilt.