HyperAI
il y a un jour

ChemDFM-R : Un raisonneur chimique basé sur un modèle linguistique grand (LLM) amélioré par des connaissances chimiques atomisées

Zihan Zhao, Bo Chen, Ziping Wan, Lu Chen, Xuanze Lin, Shiyang Yu, Situo Zhang, et al
ChemDFM-R : Un raisonneur chimique basé sur un modèle linguistique grand (LLM) amélioré par des connaissances chimiques atomisées
Résumé

Bien que les grands modèles linguistiques (LLM) aient accompli des progrès remarquables, leur application dans des domaines scientifiques tels que la chimie reste freinée par une compréhension superficielle du domaine et des capacités de raisonnement limitées. Dans ce travail, nous nous concentrons sur le domaine spécifique de la chimie et développons un grand modèle linguistique dédié au raisonnement chimique, nommé ChemDFM-R. Nous construisons tout d’abord un ensemble de données complet composé de points de connaissance atomisés afin d’améliorer la compréhension du modèle des principes fondamentaux et de la structure logique de la chimie. Ensuite, nous proposons une stratégie de distillation à sources mixtes, intégrant des connaissances soigneusement sélectionnées par des experts et des compétences générales de raisonnement dans des domaines larges, suivie d’un apprentissage par renforcement spécifique au domaine afin d’approfondir le raisonnement chimique. Des expérimentations sur divers benchmarks chimiques démontrent que ChemDFM-R atteint des performances de pointe tout en fournissant des sorties interprétables et fondées sur des chaînes de raisonnement explicites. Des études de cas supplémentaires illustrent comment les chaînes de raisonnement explicites améliorent significativement la fiabilité, la transparence et l’utilité pratique du modèle dans des scénarios réels de collaboration humain-IA.