このデータセットは、論文「Adaptive GCN Methodに基づいたDrug Repositioning」で使用されたデータセットです。
提案されたモデルのパフォーマンスを包括的に評価するために、研究チームは、Gdataset (Gottlieb et al. 2011)、Cdataset (Luo et al. 2016)、Ldataset (Yu et al. 2021)、LRSSL などの 4 つのベンチマーク データセットを使用しました。 (Liang et al. 2017)、これは薬物の再配置タスクで広く使用されています。
- Gdataset はゴールド スタンダード データセットとも考えられており、DrugBank の 593 の薬剤と OMIM データベースにリストされている 313 の疾患に関する 1933 年の検証済みの薬物と疾患の関連性が含まれています。
- Cdataset には 663 の薬物、409 の疾患、および相互作用する 2,352 の薬物と疾患のペアが含まれており、Luo et al の論文で初めて登場しました。 (2016)研究。
- Ldataset は CTD データセット (Davis et al. 2017) から編集されており、269 の薬剤と 598 の疾患の間の 18,416 の関連性が含まれています。
- 最後のデータセットである LRSSL には、763 の薬剤と 681 の疾患を含む 3,051 の検証済みの薬剤と疾患の関連性が含まれています。