2ヶ月前
Spoken SQuAD: 聴解における音声認識エラーの影響軽減に関する研究
Chia-Hsuan Li; Szu-Lin Wu; Chi-Liang Liu; Hung-yi Lee

要約
読解能力は広く研究されてきました。その中でも代表的な読解タスクの一つがスタンフォード質問応答データセット(SQuAD)であり、このタスクにおいて機械の性能はすでに人間と匹敵しています。一方で、大量のマルチメディアや音声コンテンツにアクセスすることは、平文テキストコンテンツよりも人間にとって遥かに困難で時間がかかる作業です。したがって、音声コンテンツを自動的に理解できる機械を開発することは非常に魅力的です。本論文では、新たな聴解タスクであるSpoken SQuADを提案します。この新しいタスクにおいて、我々は音声認識エラーが機械の理解能力に深刻な影響を与えることを確認しました。また、その影響を軽減するためのいくつかの手法を提案しています。