Spoken SQuAD : Une étude sur l'atténuation de l'impact des erreurs de reconnaissance vocale sur la compréhension auditive

La compréhension de la lecture a été largement étudiée. L'une des tâches les plus représentatives en matière de compréhension de la lecture est le Stanford Question Answering Dataset (SQuAD), sur lequel les machines sont déjà comparables à l'humain. D'autre part, accéder à de grandes collections de contenu multimédia ou parlé est beaucoup plus difficile et fastidieux que le contenu textuel simple pour les humains. Il est donc très attrayant de développer des machines capables de comprendre automatiquement le contenu parlé. Dans cet article, nous proposons une nouvelle tâche de compréhension auditive - SQuAD Parlé (Spoken SQuAD). Sur cette nouvelle tâche, nous avons constaté que les erreurs de reconnaissance vocale ont un impact catastrophique sur la compréhension par les machines, et plusieurs approches sont proposées pour atténuer cet impact.