6 个月前

自然语言处理

多任务学习

自然语言处理

Pierre Colombo Emile Chapuis Matteo Manica Emmanuel Vignon Giovanna Varni Chloe Clavel

摘要

基于对话内容预测对话行为（Dialog Act, DA）是构建对话智能体的关键环节。准确预测对话行为需要对对话上下文及全局标签依赖关系进行精确建模。本文采用在神经机器翻译（Neural Machine Translation, NMT）领域广泛应用的序列到序列（seq2seq）模型，以提升标签序列依赖性的建模能力。与当前多数基于线性条件随机场（Linear Conditional Random Field, CRF）的方法仅建模局部标签依赖不同，seq2seq模型能够有效捕捉复杂的全局依赖关系。本文提出一种专为对话行为分类设计的seq2seq模型，其核心包括：分层编码器、一种新颖的引导注意力机制，以及在训练和推理阶段均采用束搜索（beam search）策略。相较于现有最先进方法，本模型无需人工设计特征，可实现端到端训练。实验结果表明，该方法在SwDA数据集上取得了85%的准确率，在MRDA数据集上达到了91.6%的先进水平准确率，显著优于现有方法。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

6 个月前

自然语言处理

多任务学习

自然语言处理

Pierre Colombo Emile Chapuis Matteo Manica Emmanuel Vignon Giovanna Varni Chloe Clavel

摘要

基于对话内容预测对话行为（Dialog Act, DA）是构建对话智能体的关键环节。准确预测对话行为需要对对话上下文及全局标签依赖关系进行精确建模。本文采用在神经机器翻译（Neural Machine Translation, NMT）领域广泛应用的序列到序列（seq2seq）模型，以提升标签序列依赖性的建模能力。与当前多数基于线性条件随机场（Linear Conditional Random Field, CRF）的方法仅建模局部标签依赖不同，seq2seq模型能够有效捕捉复杂的全局依赖关系。本文提出一种专为对话行为分类设计的seq2seq模型，其核心包括：分层编码器、一种新颖的引导注意力机制，以及在训练和推理阶段均采用束搜索（beam search）策略。相较于现有最先进方法，本模型无需人工设计特征，可实现端到端训练。实验结果表明，该方法在SwDA数据集上取得了85%的准确率，在MRDA数据集上达到了91.6%的先进水平准确率，显著优于现有方法。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供