11 天前
从结构到性质:化学元素嵌入与深度学习方法在化学性质精准预测中的应用
Shokirbek Shermukhamedov, Dilorom Mamurjonova, Michael Probst

摘要
我们提出了用于化学分类任务的elEmBERT模型。该模型基于深度学习技术,采用多层编码器架构。我们在有机化合物、无机化合物及晶体化合物数据集上展示了该方法所具备的潜力。具体而言,我们利用Matbench和Moleculenet基准数据集对模型进行了开发与测试,其中涵盖了晶体性质预测以及与药物设计相关的任务。此外,我们还对化学化合物的向量表示进行了深入分析,揭示了结构数据中潜在的模式特征。实验结果表明,该模型展现出卓越的预测能力,并在分子与材料数据集上均具有广泛的适用性。例如,在Tox21数据集上,模型平均精度达到96%,较此前最优结果提升了10%。