2 个月前
药物组合的N元关系抽取数据集
Aryeh Tiktinsky; Vijay Viswanathan; Danna Niezni; Dana Meron Azagury; Yosi Shamay; Hillel Taub-Tabib; Tom Hope; Yoav Goldberg

摘要
联合疗法已成为癌症、结核病、疟疾和艾滋病等疾病的标准治疗方案。然而,可用的多药治疗组合数量庞大,这给识别特定情况下的有效联合疗法带来了挑战。为了帮助医疗专业人员识别有益的药物组合,我们构建了一个由专家注释的数据集,用于从科学文献中提取有关药物组合疗效的信息。除了其实用价值外,该数据集还提出了一个独特的自然语言处理(NLP)挑战,因为它是首个包含可变长度关系的关系抽取数据集。此外,该数据集中大多数关系的理解需要超越句子层面的语言理解能力,进一步增加了这一任务的难度。我们提供了一个有前景的基线模型,并明确了进一步改进的方向。我们公开发布了数据集、代码和基线模型,以鼓励自然语言处理社区参与这一任务。