
摘要
准确预测分子性质在药物发现与计算化学中具有关键作用,有助于识别有前景的化合物并加速治疗药物的研发进程。传统机器学习方法在处理高维数据时表现欠佳,且依赖人工特征工程;而现有深度学习方法在捕捉复杂分子结构方面仍存在局限,由此形成了研究空白。为此,本文提出一种新型框架——Deep-CBN,旨在通过直接从原始数据中学习复杂的分子表征,提升分子性质预测的准确性与效率。该方法将卷积神经网络(CNN)与BiFormer注意力机制相结合,并融合前向-前向算法(forward-forward algorithm)与反向传播(backpropagation)策略。模型运行分为三个阶段:(1)特征学习阶段,利用CNN从SMILES字符串中提取局部特征;(2)注意力精炼阶段,通过引入前向-前向算法增强的BiFormer模块捕捉全局上下文信息;(3)预测子网络调优阶段,采用反向传播进行精细化调整。在Tox21、BBBP、SIDER、ClinTox、BACE、HIV和MUV等多个基准数据集上的评估结果表明,Deep-CBN实现了接近完美的ROC-AUC得分,显著优于当前最先进的方法。研究结果充分证明了该模型在捕捉复杂分子模式方面的强大能力,为加速药物发现过程提供了一个高效可靠的工具。