CHiME-5-Spracherkennungsdatensatz
Datum
vor 3 Jahren
Veröffentlichungs-URL
Kategorien

CHiME-5 ist ein Datensatz zur automatischen Spracherkennungsverarbeitungstechnologie. Der Datensatz stammt aus der 5. CHiME-Challenge, die die Aufgabe einer Ferngesprächsführung mit mehreren Mikrofonen in einer realen häuslichen Umgebung umfasst. Das Sprachmaterial ist einer Dinnerszene entnommen. Der Datensatz enthält natürliche Gesprächssprachdaten und wird von 6 Kinect-Mikrofon-Arrays und 4 binauralen Mikrofonpaaren aufgezeichnet.
Der Datensatz umfasst Datenerfassungsverfahren, Aufgaben und Basissysteme für die Sprachmodellierung mit einem und mehreren Arrays sowie Array-Synchronisierung, Sprachverbesserung, konventionelle und End-to-End-ASR.