
摘要
引用在科学论文中不仅有助于追溯知识谱系,还是衡量研究工作科学意义的重要指标。引用意图的明确有助于指明特定上下文中引用的作用。本文介绍了CitePrompt框架,该框架采用了此前未被探索的基于提示的学习方法进行引用意图分类。我们认为,通过选择合适的预训练语言模型、提示模板和提示词汇化器,不仅可以获得优于或媲美现有最先进方法的结果,而且可以大大减少对外部科学文档信息的需求。我们在ACL-ARC数据集上报告了最先进水平的结果,并且在SciCite数据集上对所有基线模型(除一个外)都显示了显著改进。由于适合用于引用意图分类的大规模标注数据集较为难寻,我们首次提出了将此任务转换为少样本和零样本设置的方法。对于ACL-ARC数据集,在零样本设置下,我们报告了53.86%的F1分数,而在5样本和10样本设置下分别提高到了63.61%和66.99%。