2 个月前

基于全注意力机制的信息检索器

Alvaro Henrique Chaim Correia; Jorge Luiz Moreira Silva; Thiago de Castro Martins; Fabio Gagliardi Cozman
基于全注意力机制的信息检索器
摘要

循环神经网络目前在自然语言处理领域处于领先地位,因为它们能够构建丰富的上下文表示并处理任意长度的文本。然而,最近关于注意力机制的发展赋予了前馈网络类似的能力,从而由于可并行操作数量的增加而实现了更快的计算。我们在问答领域探索了这种新型架构,并提出了一种称为全注意力信息检索器(Fully Attention Based Information Retriever, FABIR)的新方法。我们展示了FABIR在斯坦福问答数据集(Stanford Question Answering Dataset, SQuAD)中取得了具有竞争力的结果,同时其参数更少且在学习和推理过程中比竞争对手的方法更快。

基于全注意力机制的信息检索器 | 最新论文 | HyperAI超神经