Spoken SQuAD: Eine Studie zur Milderung der Auswirkungen von Spracherkennungsfehlern auf das Hörverstehen

Die Leseverständnisfähigkeit wurde weitgehend untersucht. Eine der repräsentativsten Aufgaben im Bereich des Leseverständnisses ist das Stanford Question Answering Dataset (SQuAD), bei dem Maschinen bereits mit Menschen vergleichbar sind. Andererseits ist für Menschen der Zugriff auf große Sammlungen von Multimedia- oder gesprochenen Inhalten viel schwieriger und zeitaufwendiger als auf reine Textinhalte. Es ist daher sehr attraktiv, Maschinen zu entwickeln, die gesprochene Inhalte automatisch verstehen können. In dieser Arbeit schlagen wir eine neue Aufgabe im Bereich des Hörverstehens vor – Spoken SQuAD. Bei dieser neuen Aufgabe stellten wir fest, dass Spracherkennungsfehler katastrophale Auswirkungen auf das maschinelle Verständnis haben, und es werden mehrere Ansätze vorgeschlagen, um diese Auswirkungen zu mildern.