2 个月前

CLDR:基于自然语言监督的对比学习药物反应模型

Kun Li; Wenbin Hu
CLDR:基于自然语言监督的对比学习药物反应模型
摘要

基于深度学习的药物反应预测(DRP)方法可以加速药物发现过程并降低研发成本。尽管主流方法在预测反应回归值方面取得了高精度,但这些方法的回归感知表示却支离破碎,无法捕捉样本顺序的连续性。这一现象导致模型被优化到次优解空间,降低了泛化能力,并可能在药物发现阶段造成巨大的浪费成本。本文提出了一种名为 \MN 的对比学习框架,该框架利用自然语言监督进行 DRP。该框架将回归标签转换为文本,并将其与药物反应的标题文本合并,作为与传统模态(图、序列)相比的样本第二模态。在每个批次中,一个样本的两种模态被视为正对,其他对则被视为负对。同时,为了增强数值文本的连续表示能力,引入了一个常识数值知识图谱。我们从癌症药物敏感性基因组学数据集中验证了数十万个样本,观察到应用我们的框架后,DRP 方法的平均改进率在 7.8% 至 31.4% 之间。实验结果证明,\MN 有效地将样本约束在表示空间中的连续分布上,并且在预训练后仅需少量微调即可实现令人印象深刻的预测性能。代码可在以下地址获取:\url{https://gitee.com/xiaoyibang/clipdrug.git}。

CLDR:基于自然语言监督的对比学习药物反应模型 | 最新论文 | HyperAI超神经