
摘要
联合药物疗法是指涉及两种或更多种药物的治疗方案,通常用于癌症、HIV、疟疾或结核病患者的治疗。目前,在PubMed中使用“联合药物疗法”(MeSH主题词)的文章已超过35万篇,过去二十年每年至少有1万篇文章发表。从科学文献中提取联合疗法本质上构成了一个$n$元关系抽取问题。与一般$n$元设置中$n$固定的情况不同(例如,药物-基因-突变关系中的$n=3$),提取联合疗法是一个特殊的设置,其中$n \geq 2$且动态变化,具体取决于每个实例。最近,Tiktinsky等人(NAACL 2022)引入了一个名为CombDrugExt的数据集,专门用于从文献中提取此类疗法。在此研究中,我们采用了一种序列到序列的端到端抽取方法,在CombDrugExt测试集上对阳性(或有效)组合达到了66.7%的F1分数。这一成绩比先前最佳的关系分类得分(在已识别的药物实体基础上进行分类,因此不是端到端的方法)提高了约5个百分点的绝对F1分数。因此,我们的工作引入了首个适用于端到端抽取的任务模型,并且已经优于此前最佳的非端到端模型。我们的模型能够在一次运行中无缝提取所有药物实体及其关系,非常适合动态$n$元抽取场景。