Die Minderung der Auswirkungen von Spracherkennungsfehlern auf die befragte Antwort durch feindliche Domänenanpassung

Die befragung von gesprochenen Dokumenten durch Sprachausgabe (Spoken Question Answering, SQA) ist aufgrund der komplexen Schlussfolgerungen, die auf diesen Dokumenten basieren, herausfordernd. Neueste Studien haben zudem den katastrophalen Einfluss von Fehlern der automatischen Spracherkennung (Automatic Speech Recognition, ASR) auf SQA nachgewiesen. Daher zielt diese Arbeit darauf ab, die ASR-Fehler durch die Angleichung der Diskrepanz zwischen ASR-Hypothesen und den entsprechenden Referenztranskriptionen zu reduzieren. Ein adversariales Modell wird für diese Domänenanpassung eingesetzt, das das Modell dazu zwingt, domänenunabhängige Merkmale zu lernen, die das QA-Modell effektiv nutzen kann, um die Ergebnisse des SQA zu verbessern. Die Experimente zeigen erfolgreich die Effektivität unseres vorgeschlagenen Modells; die Ergebnisse sind um 2 %punkte im EM-Score besser als die des bisher besten Modells.