
摘要
近期在机器学习领域的进展对药物发现做出了重要贡献。特别是深度神经网络已被证明在推断小分子化合物的性质和活性时能显著提高预测能力。然而,这些技术的应用受到大量训练数据需求的限制。在这项研究中,我们展示了如何利用单次学习(one-shot learning)大幅减少药物发现应用中进行有意义预测所需的数据量。我们引入了一种新的架构——残差LSTM嵌入(residual LSTM embedding),当与图卷积神经网络结合使用时,该架构显著提高了学习小分子之间有意义距离度量的能力。我们开源了本研究中介绍的所有模型,作为DeepChem框架的一部分,DeepChem是一个用于药物发现的开源深度学习框架。