ChemDFM-R: Ein chemischer Schlussfolgerungs-LLM, der durch atomisierte chemische Kenntnisse verbessert wurde

Obwohl große Sprachmodelle (Large Language Models, LLMs) beachtliche Fortschritte erzielt haben, bleibt ihre Anwendung in wissenschaftlichen Fachgebieten wie der Chemie durch eine oberflächliche Domänenverständnis und begrenzte Schlussfolgerungsfähigkeiten eingeschränkt. In dieser Arbeit konzentrieren wir uns auf den spezifischen Bereich der Chemie und entwickeln ein chemie-spezifisches Schlussfolgerungs-LLM namens ChemDFM-R. Zunächst erstellen wir eine umfassende Datensammlung atomisierter Wissenspunkte, um das Modell in seiner Auffassung grundlegender chemischer Prinzipien und logischer Strukturen zu stärken. Anschließend schlagen wir eine gemischte Quellen-Distillationstrategie vor, die fachlich expertengeführtes Wissen mit allgemeindomänenbasierten Schlussfolgerungsfähigkeiten kombiniert, gefolgt von domain-spezifischem Verstärkungslernen zur Verbesserung der chemischen Schlussfolgerungskapazität. Experimente an diversen chemischen Benchmark-Daten zeigen, dass ChemDFM-R herausragende Leistung erzielt und gleichzeitig interpretierbare, rationale Ausgaben liefert. Weitere Fallstudien verdeutlichen, wie explizite Schlussfolgerungsketten die Zuverlässigkeit, Transparenz und praktische Relevanz des Modells in realen Szenarien der menschlich-künstlichen Zusammenarbeit erheblich verbessern.