2ヶ月前
EVI: 知識ベースの登録、認証、および識別向け多言語音声対話タスクとデータセット
Georgios P. Spithourakis; Ivan Vulić; Michał Lis; Iñigo Casanueva; Paweł Budzianowski

要約
知識ベース認証は、パーソナライズされたプライバシー重視のサービスを提供するタスク指向の音声対話システムにおいて重要な役割を果たします。これらのシステムは、ユーザーの個人情報(例:郵便番号、氏名、生年月日)に基づいて、新規および既存のユーザーを登録(E)、認証(V)、識別(I)できる必要があります。本研究では、3つの認証タスクとその評価プロトコルを形式化し、EVIという難易度の高い多言語音声対話データセットを紹介します。このデータセットには、英語、ポーランド語、フランス語で5,506件の対話が含まれています。我々が提案したモデルは初めて競争力のあるベンチマークを設定し、多言語音声対話の自然言語処理における課題を探求し、今後の研究方向性を示しています。