HyperAIHyperAI

Command Palette

Search for a command to run...

深度残差输出层在神经语言生成中的应用

Nikolaos Pappas James Henderson

摘要

许多任务,包括语言生成,都能从学习输出空间的结构中受益,尤其是在输出标签空间较大且数据稀疏的情况下。最先进的神经语言模型通过其分类器权重间接捕捉输出空间的结构,因为这些模型在输出标签之间缺乏参数共享。学习共享的输出标签映射有助于提高性能,但现有的方法表达能力有限且容易过拟合。本文中,我们研究了更强大的共享映射对输出标签的有效性,并提出了一种带有层间dropout的深度残差输出映射,以更好地捕捉输出空间的结构并避免过拟合。我们在三个语言生成任务上的评估表明,我们的输出标签映射可以匹配或超越最先进的循环神经网络和自注意力架构,并暗示如果分类器能够更好地捕捉输出空间的结构,则不一定需要高秩来更好地建模自然语言。


用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码
开箱即用的 GPU
最优定价

HyperAI Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供