2 个月前

学习构建任务特定的树结构

Jihun Choi; Kang Min Yoo; Sang-goo Lee
学习构建任务特定的树结构
摘要

多年来,递归神经网络(RvNNs)已被证明适用于将文本表示为固定长度向量,并在多个自然语言处理任务中取得了良好的性能。然而,RvNNs的主要缺点是需要结构化的输入,这使得数据准备和模型实现较为困难。本文提出了一种新颖的树结构长短期记忆网络架构——Gumbel Tree-LSTM,该架构能够高效地仅从纯文本数据中学习如何构建任务特定的树结构。我们的模型使用了直通Gumbel-Softmax估计器来动态选择候选节点中的父节点,并计算离散决策的梯度。我们在自然语言推理和情感分析任务上对所提出的模型进行了评估,结果表明我们的模型优于或至少与先前的模型相当。此外,我们发现我们的模型比其他模型收敛速度显著更快。