CHiME-5-Spracherkennungsdatensatz
Datum
Veröffentlichungs-URL
Paper-URL

CHiME-5 ist ein Datensatz zur automatischen Spracherkennungsverarbeitungstechnologie. Der Datensatz stammt aus der 5. CHiME-Challenge, die die Aufgabe einer Ferngesprächsführung mit mehreren Mikrofonen in einer realen häuslichen Umgebung umfasst. Das Sprachmaterial ist einer Dinnerszene entnommen. Der Datensatz enthält natürliche Gesprächssprachdaten und wird von 6 Kinect-Mikrofon-Arrays und 4 binauralen Mikrofonpaaren aufgezeichnet.
Der Datensatz umfasst Datenerfassungsverfahren, Aufgaben und Basissysteme für die Sprachmodellierung mit einem und mehreren Arrays sowie Array-Synchronisierung, Sprachverbesserung, konventionelle und End-to-End-ASR.
KI mit KI entwickeln
Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.