CHIME-Sprachdatensatz
Datum
Veröffentlichungs-URL
Kategorien
Der CHiME-Datensatz basiert auf Sprachclips der CHiME-Challenge und wird hauptsächlich zur Spracherkennung verwendet.
Bei der CHiME-Challenge handelt es sich um ein automatisches Spracherkennungsbewertungssystem für die weitreichende Spracherkennung mit mehreren Mikrofonen in alltäglichen Umgebungen.
Der Datensatz umfasst binaural mit einem statischen Lautsprecher aufgenommene Audiodaten für ASR-Aufgaben mit kleinem Wortschatz in einer häuslichen Umgebung, binaural mit einem mobilen Lautsprecher aufgenommene Audiodaten und ASR-Aufgaben mit mittlerem Wortschatz in einer häuslichen Umgebung, Audiodaten, die mit 1-, 2- und 6-Kanal-Tablet-Geräten in vielen städtischen Innen- und Außenbereichen aufgenommen wurden, sowie Mehrparteiengespräche mit einem Fernmikrofon in einer häuslichen Umgebung.
Die CHiME-Challenge begann 2010 mit Jon Barker, Shinji Watanabe und Emmanuel Vincent als Hauptinitiatoren.
Die relevanten Dokumente sind wie folgt:
„Das CHiME-Korpus: eine Ressource und eine Herausforderung für Computational Hearing in Multisource-Umgebungen“
„Die Herausforderung der Sprachtrennung und -erkennung bei PASCAL CHiME“
„Die zweite CHiME-Herausforderung zur Sprachtrennung und -erkennung: Datensätze, Aufgaben und Basislinien“
„Die zweite CHiME-Herausforderung zur Sprachtrennung und -erkennung: Ein Überblick über die Herausforderungssysteme und Ergebnisse“
„Die dritte Herausforderung der CHIME-Sprachtrennung und -erkennung: Analyse und Ergebnisse“
„Eine Analyse von Umgebungs-, Mikrofon- und Datensimulationsfehlanpassungen bei der robusten Spracherkennung“
„Die fünfte „CHiME“-Herausforderung zur Sprachtrennung und -erkennung: Datensatz, Aufgabe und Basislinien“