该数据集为论文「基于自适应 GCN 方法进行药物重新定位」使用的数据集。
为了全面评估所提出的模型性能,研究团队使用了四个基准数据集,例如 Gdataset(Gottlieb et al. 2011)、 Cdataset(Luo et al. 2016)、 Ldataset(Yu et al. 2021)和 LRSSL(Liang et al. 2017),广泛应用于药物重新定位任务。
- Gdataset 也被视为黄金标准数据集,其中包括 1933 年经过验证的药物与疾病之间的关联,这些关联来自 DrugBank 的 593 种药物与 OMIM 数据库中列出的 313 种疾病。
- Cdataset 包含 663 种药物、 409 种疾病和 2352 个相互作用的药物-疾病对,首次出现在 Luo 等人的论文中。(2016)研究。
- Ldataset 由 CTD 数据集(Davis et al. 2017)编译而成,包含 269 种药物与 598 种疾病之间的 18,416 个关联。
- 最后一个数据集 LRSSL 包含 3,051 个经过验证的药物-疾病关联,涉及 763 种药物和 681 种疾病。