
摘要
在本文中,我们介绍了本团队在NSURL 2019语义文本问题相似性任务中的研究成果。我们表现最优的系统采用多种创新的数据增强技术,有效扩充了训练数据规模。随后,系统利用ELMo预训练的上下文嵌入表示对数据进行编码,并将其输入到带有自注意力机制的ON-LSTM网络中,生成序列表示向量,用于预测问题对之间的语义关系。该模型在公开排行榜上以96.499的F1分数位列第一(与第二名F1分数相同),在私有排行榜上以94.848的F1分数位列第二,较第一名低1.076的F1分数。
在本文中,我们介绍了本团队在NSURL 2019语义文本问题相似性任务中的研究成果。我们表现最优的系统采用多种创新的数据增强技术,有效扩充了训练数据规模。随后,系统利用ELMo预训练的上下文嵌入表示对数据进行编码,并将其输入到带有自注意力机制的ON-LSTM网络中,生成序列表示向量,用于预测问题对之间的语义关系。该模型在公开排行榜上以96.499的F1分数位列第一(与第二名F1分数相同),在私有排行榜上以94.848的F1分数位列第二,较第一名低1.076的F1分数。