HyperAIHyperAI

Command Palette

Search for a command to run...

事前学習済みのシーケンス・ツー・シーケンスモデルを用いた文書ランキング

Rodrigo Nogueira, Zhiying Jiang, Jimmy Lin

概要

本研究提出了一种预训练序列到序列模型在文档排序任务中的新适应方法。我们的方法从根本上不同于基于仅编码器预训练变压器架构(如BERT)的常用分类方法。我们展示了如何训练序列到序列模型生成相关性标签作为“目标词”,以及这些目标词的底层logits如何被解释为用于排序的相关性概率。在流行的MS MARCO段落排序任务中,实验结果显示我们的方法至少与之前的分类方法相当,并且可以使用更大、更新的模型超越它们。在TREC 2004 Robust Track的测试集合上,我们证明了零样本迁移学习方法优于需要数据集内交叉验证的以往最先进模型。此外,我们发现,在数据稀缺的情况下(即训练样本较少时),我们的方法显著优于仅编码器模型。为了进一步探讨这一观察结果,我们通过改变目标词来探究模型对潜在知识的利用情况。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています
事前学習済みのシーケンス・ツー・シーケンスモデルを用いた文書ランキング | 記事 | HyperAI超神経