HyperAI

CHiME-5-Spracherkennungsdatensatz

Datum

vor 3 Jahren

Organisation

Universität Sheffield

Veröffentlichungs-URL

github.com

Kategorien

Download-Hilfe
特色图像

CHiME-5 ist ein Datensatz zur automatischen Spracherkennungsverarbeitungstechnologie. Der Datensatz stammt aus der 5. CHiME-Challenge, die die Aufgabe einer Ferngesprächsführung mit mehreren Mikrofonen in einer realen häuslichen Umgebung umfasst. Das Sprachmaterial ist einer Dinnerszene entnommen. Der Datensatz enthält natürliche Gesprächssprachdaten und wird von 6 Kinect-Mikrofon-Arrays und 4 binauralen Mikrofonpaaren aufgezeichnet.

Der Datensatz umfasst Datenerfassungsverfahren, Aufgaben und Basissysteme für die Sprachmodellierung mit einem und mehreren Arrays sowie Array-Synchronisierung, Sprachverbesserung, konventionelle und End-to-End-ASR.