2 个月前
EVI:基于知识的多语言口语对话任务和数据集用于注册、验证和识别
Georgios P. Spithourakis; Ivan Vulić; Michał Lis; Iñigo Casanueva; Paweł Budzianowski

摘要
基于知识的身份验证对于提供个性化和隐私保护服务的任务导向型语音对话系统至关重要。此类系统应能够根据用户的个人信息(如邮政编码、姓名和出生日期)注册(E)、验证(V)和识别(I)新用户和回头用户。在本研究中,我们对这三项身份验证任务及其评估协议进行了形式化定义,并介绍了EVI,这是一个具有挑战性的多语言语音数据集,包含5,506段英语、波兰语和法语的对话。我们提出的模型设定了首个有竞争力的基准,探讨了多语言语音对话的自然语言处理所面临的挑战,并为未来的研究指明了方向。