HyperAI

AISHELL-DMASH Chinesisches Mandarin-Mikrofon-Array Home Scene Speech Database

Datum

vor einem Jahr

Organisation

Veröffentlichungs-URL

www.aishelltech.com

Download-Hilfe

Der AISHELL-DMASH-Datensatz wurde in realen Smart-Home-Szenarien in zwei verschiedenen Räumen aufgezeichnet und enthält 30.000 Stunden Sprachdaten.Die Aufnahmeausrüstung bestand aus einem Nahbereichsmikrofon und 7 Ausrüstungssätzen, die an 7 verschiedenen Stellen im Raum angebracht waren. Zu den Aufnahmegeräten gehören ein iPhone, ein Android-Telefon, ein iPad, ein Mikrofon und ein kreisförmiges Mikrofon-Array mit einem Radius von 5 cm. Der Datensatz enthält 511 Sprecher, von denen jeder dreimal im Abstand von 7–15 Tagen besucht wurde. Der AISHELL-DMASH-Datensatz wird von professionellen Sprachannotatoren mit einer Wortgenauigkeit von 98% transkribiert. Es kann für Forschungszwecke wie Stimmabdruckerkennung, Spracherkennung und Aktivierungsworterkennung verwendet werden.