8 个月前

自然语言处理

多任务学习

自然语言处理

Ryan Lowe Nissan Pow Iulian V. Serban Joelle Pineau

摘要

本文介绍了Ubuntu对话语料库，该数据集包含近100万个多轮对话，总共有超过700万条发言和1亿个词汇。这一资源为基于神经语言模型构建对话管理器的研究提供了独特支持，这些模型可以利用大量未标注的数据。该数据集不仅具备了对话状态跟踪挑战数据集中对话的多轮特性，还具有类似Twitter等微博服务中互动的非结构化性质。我们还描述了两种适用于分析此数据集的神经学习架构，并提供了在选择最佳下一轮回应任务上的基准性能结果。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

Ubuntu对话语料库：一个用于非结构化多轮对话系统研究的大型数据集 | 论文 | HyperAI超神经