2 days ago
ChemDFM-R:一种融合原子化化学知识的化学推理LLM
Zihan Zhao, Bo Chen, Ziping Wan, Lu Chen, Xuanze Lin, Shiyang Yu, Situo Zhang, et al

摘要
尽管大型语言模型(LLMs)已取得显著进展,但在化学等科学领域的应用仍受限于对领域知识的浅层理解以及有限的推理能力。本文聚焦于化学这一具体领域,提出一种面向化学推理的大型语言模型——ChemDFM-R。我们首先构建了一个涵盖原子化知识单元的综合性数据集,以增强模型对化学基本原理与逻辑结构的理解。随后,提出一种混合来源的知识蒸馏策略,融合专家标注的知识与通用领域推理能力,并结合领域特定的强化学习进一步提升化学推理性能。在多个化学基准测试上的实验结果表明,ChemDFM-R不仅实现了当前最先进的性能,还能生成可解释、基于推理链条的输出。进一步的案例研究显示,显式的推理链显著提升了模型在真实人机协作场景中的可靠性、透明性与实际应用价值。