Zhuoqun Li Xuanang Chen Hongyu Lin Yaojie Lu Xianpei Han Le Sun

摘要
论文检索是研究人员的一项重要活动,通常涉及使用描述某一主题的查询语句来查找相关文献。随着研究的深入,论文检索的需求可能变得更加灵活,有时需要包含具体细节(如模块配置等),而不再局限于粗粒度的主题范围。然而,现有的论文检索系统难以满足这种细粒度的检索需求,因为这些系统主要依赖论文摘要构建语料库索引,缺乏支持细粒度查询所需的具体信息。为此,本文提出 PaperRegister,该系统由离线的分层索引与在线的自适应检索两部分组成,将传统的基于摘要的索引方式转化为分层索引树结构,从而支持灵活粒度的查询。在涵盖多种粒度级别的论文检索任务上的实验表明,PaperRegister 达到了当前最先进的性能,尤其在细粒度场景下表现突出,展现出其在真实应用场景中作为灵活粒度论文检索有效解决方案的巨大潜力。本工作的代码已开源,地址为:https://github.com/Li-Z-Q/PaperRegister。