HyperAI超神経
2日前

ChemDFM-R:原子化化学知識を統合した化学推論型言語モデル

Zihan Zhao, Bo Chen, Ziping Wan, Lu Chen, Xuanze Lin, Shiyang Yu, Situo Zhang, et al
ChemDFM-R:原子化化学知識を統合した化学推論型言語モデル
要約

大規模言語モデル(LLM)は著しい進展を遂げているが、化学をはじめとする科学分野への応用は、領域理解の浅さと推論能力の限界により、依然として制限されている。本研究では、化学という特定分野に焦点を当て、化学推論専用のLLM「ChemDFM-R」を構築した。まず、化学の基礎原理および論理構造に対するモデルの理解を強化するため、原子化された知識ポイントを網羅的に構築したデータセットを構築した。次に、専門家が整備した知識と汎用領域の推論スキルを統合するミックスソース蒸留戦略を提案し、その後、化学分野特有の強化学習を適用して化学的推論能力を向上させた。多様な化学ベンチマークにおける実験結果から、ChemDFM-Rは最先端の性能を達成するとともに、解釈可能で根拠に基づく出力を提供することが明らかになった。さらに、事例研究により、明示的な推論チェーンが、実世界における人間とAIの協働環境において、モデルの信頼性、透明性、実用性を著しく向上させることを示した。