HyperAIHyperAI

Command Palette

Search for a command to run...

学习构建任务特定的树结构

Jihun Choi; Kang Min Yoo; Sang-goo Lee

摘要

多年来,递归神经网络(RvNNs)已被证明适用于将文本表示为固定长度向量,并在多个自然语言处理任务中取得了良好的性能。然而,RvNNs的主要缺点是需要结构化的输入,这使得数据准备和模型实现较为困难。本文提出了一种新颖的树结构长短期记忆网络架构——Gumbel Tree-LSTM,该架构能够高效地仅从纯文本数据中学习如何构建任务特定的树结构。我们的模型使用了直通Gumbel-Softmax估计器来动态选择候选节点中的父节点,并计算离散决策的梯度。我们在自然语言推理和情感分析任务上对所提出的模型进行了评估,结果表明我们的模型优于或至少与先前的模型相当。此外,我们发现我们的模型比其他模型收敛速度显著更快。


用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码
开箱即用的 GPU
最优定价

HyperAI Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供