
복합 약물 치료는 두 가지 이상의 약물을 사용하는 치료 계획으로, 주로 암, HIV, 말라리아 또는结核病患者使用。目前,在PubMed中使用“复方药物治疗”MeSH标题的文章超过35万篇,过去二十年每年至少有1万篇文章发表。从科学文献中提取复方疗法本质上是一个$n$元关系抽取问题。与一般$n$元设置中$n$固定的情况不同(例如,药物-基因-突变关系中的$n=3$),提取复方疗法是一种特殊设置,其中$n \geq 2$是动态变化的,取决于每个实例。最近,Tiktinsky等人(NAACL 2022)引入了一个名为CombDrugExt的数据集,用于从文献中抽取此类疗法。在此研究中,我们采用了一种序列到序列式的端到端抽取方法,在CombDrugExt测试集中对阳性(或有效)组合达到了66.7%的F1分数。即使与之前最佳的关系分类得分相比(该分类得分基于已识别的药物实体,因此不是端到端的),这也实现了约5%的绝对F1分数提升。因此,我们的努力为这一任务引入了首个端到端抽取模型,其性能已经优于此前的最佳非端到端模型。我们的模型可以在一次运行中无缝提取所有药物实体及其关系,并且非常适合用于动态$n$元抽取场景。修正后的韩文翻译如下:복합약물치료는 두 가지 이상의 약물을 사용하는 치료 계획으로, 주로 암, HIV, 말라리아 또는 결핵 환자에게 투여됩니다. 현재 PubMed에서 "복합약물치료" MeSH 항목을 사용한 논문은 35만 건이 넘으며, 지난 20년 동안 매년 최소 1만 건의 논문이 발표되었습니다. 과학 문헌에서 복합약물치료를 추출하는 것은 본질적으로 $n$-원 관계 추출 문제입니다. 일반적인 $n$-원 설정에서는 $n$이 고정되어 있지만 (예: 약물-유전자-돌연변이 관계에서 $n=3$), 복합약물치료를 추출하는 경우는 특수한 설정으로, 여기서 $n \geq 2$가 동적으로 변하며 각 사례에 따라 다릅니다. 최근 Tiktinsky 등 (NAACL 2022)은 이러한 치료법을 문헌에서 추출하기 위한 데이터셋인 CombDrugExt를 소개했습니다. 본 연구에서는 시퀀스-투-시퀀스 방식의 단일 통로 추출 방법을 사용하여 CombDrugExt 테스트 세트에서 양성(또는 효과적) 조합에 대해 66.7%의 F1 점수를 달성했습니다. 이는 식별된 약물 엔티티를 기반으로 한 이전 최고 관계 분류 점수보다도 (따라서 비단일 통로) 약 5%의 절대 F1 점수 개선을 의미합니다. 따라서 우리의 노력은 이 작업을 위해 최초로 단일 통로 추출 모델을 도입하였으며, 이미 이전 최고 비단일 통로 모델보다 우수한 성능을 보이고 있습니다. 우리의 모델은 단일 패스에서 모든 약물 엔티티와 관계를 원활하게 추출할 수 있으며, 동적인 $n$-원 관계 추출 상황에 매우 적합합니다.注:在翻译过程中,“结核病”被正确翻译为“결핵”,并且整体句子结构和表达方式进行了调整以更好地适应韩语的习惯和风格。