KinFormer : Régression symbolique dynamique généralisable pour la cinématique des réactions organiques catalytiques

La modélisation d'équations cinétiques est essentielle pour comprendre les mécanismes des réactions chimiques, mais il s'agit d'une tâche complexe et chronophage. La prédiction des équations cinétiques est formulée comme un problème de régression symbolique dynamique (DSR) soumis à des contraintes de chimie physique. L'apprentissage profond (DL) offre la possibilité de capturer les motifs de réaction et de prédire les équations cinétiques à partir des données sur les espèces chimiques, évitant ainsi efficacement le biais empirique et améliorant l'efficacité par rapport aux méthodes analytiques traditionnelles. Malgré de nombreuses études axées sur le DSR et l'introduction des Transformers pour prédire des équations différentielles ordinaires, les modèles correspondants manquent de capacités de généralisation dans diverses catégories de réactions. Dans cette étude, nous proposons KinFormer, un modèle prédictif d'équations cinétiques généralisable. KinFormer utilise un Transformer conditionnel pour modéliser le DSR sous contraintes physiques et emploie une recherche arborescente Monte Carlo pour appliquer le modèle à de nouveaux types de réactions. Les résultats expérimentaux sur 20 types de réactions organiques montrent que KinFormer non seulement surpassent les baselines classiques, mais également les baselines Transformer dans les évaluations hors domaine, démontrant ainsi sa capacité de généralisation.