7 个月前

自然语言处理

自然语言处理

Andrew McCallum Mohit Iyyer Tim O'Gorman Yi-Pei Chen Subendhu Rongali Andrew Drozdov

摘要

深度的内外递归自编码器（DIORA；Drozdov 等，2019）是一种自监督神经模型，能够对输入句子进行句法树结构的推断，而无需依赖标注的训练数据。本文发现，尽管 DIORA 通过软动态规划方法对句子的所有可能二叉树进行了穷尽编码，但其向量平均策略具有局部贪心特性，在自底向上的图表解析（bottom-up chart parsing）中计算最高得分句法树时，无法纠正错误。为解决这一问题，我们提出 S-DIORA，这是 DIORA 的改进版本：通过在图表的每个单元格中引入硬性 argmax 操作与束搜索（beam）机制，使模型仅编码单一树结构，而非对多棵树进行软加权混合。实验结果表明，通过使用新算法对预训练的 DIORA 模型进行微调，我们在英语 WSJ Penn Treebank 数据集上实现了无监督成分句法分析的最新性能，F1 值提升 2.2% 至 6%，具体提升幅度取决于微调所用数据。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

7 个月前

自然语言处理

自然语言处理

Andrew McCallum Mohit Iyyer Tim O'Gorman Yi-Pei Chen Subendhu Rongali Andrew Drozdov

摘要

深度的内外递归自编码器（DIORA；Drozdov 等，2019）是一种自监督神经模型，能够对输入句子进行句法树结构的推断，而无需依赖标注的训练数据。本文发现，尽管 DIORA 通过软动态规划方法对句子的所有可能二叉树进行了穷尽编码，但其向量平均策略具有局部贪心特性，在自底向上的图表解析（bottom-up chart parsing）中计算最高得分句法树时，无法纠正错误。为解决这一问题，我们提出 S-DIORA，这是 DIORA 的改进版本：通过在图表的每个单元格中引入硬性 argmax 操作与束搜索（beam）机制，使模型仅编码单一树结构，而非对多棵树进行软加权混合。实验结果表明，通过使用新算法对预训练的 DIORA 模型进行微调，我们在英语 WSJ Penn Treebank 数据集上实现了无监督成分句法分析的最新性能，F1 值提升 2.2% 至 6%，具体提升幅度取决于微调所用数据。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供