2 个月前
使用神经序列到序列模型进行逆合成反应预测
Bowen Liu; Bharath Ramsundar; Prasad Kawthekar; Jade Shi; Joseph Gomes; Quang Luu Nguyen; Stephen Ho; Jack Sloane; Paul Wender; Vijay Pande

摘要
我们描述了一种完全数据驱动的模型,该模型学习执行逆合成反应预测任务,这一任务被视为序列到序列映射问题。端到端训练的模型采用了编码器-解码器架构,由两个循环神经网络组成,此前在解决其他序列到序列预测任务(如机器翻译)中已取得显著成功。该模型基于来自美国专利文献的50,000个实验反应示例进行训练,这些示例涵盖了药物化学家常用的10种广泛的反应类型。我们发现,我们的模型性能与基于规则的专家系统基线模型相当,并且克服了与基于规则的专家系统以及包含基于规则的专家系统组件的任何机器学习方法相关的某些局限性。我们的模型为解决计算逆合成分析这一具有挑战性的问题提供了重要的第一步。