IA pour simulations moléculaires : la physique n'est plus indispensable
Une nouvelle étude publiée dans The Journal of Chemical Physics remet en question la nécessité d'intégrer des principes physiques explicites dans les modèles d'intelligence artificielle dédiés à la simulation moléculaire. Les chercheurs Max Eissler, Tim Korjakow, Stefan Ganscha, Oliver T. Unke, Klaus-Robert Müller et Stefan Gugler, issus du BIFOLD à Berlin et de Google DeepMind, ont développé une approche novatrice appelée MD-ET. Contrairement aux méthodes classiques qui imposent des contraintes physiques comme la conservation de l'énergie ou l'équivariance dans l'architecture du modèle, MD-ET repose sur un transformateur standard adapté avec parcimonie, apprenant les comportements physiques uniquement par exposition à de vastes ensembles de données. La simulation moléculaire, qui modélise le mouvement des atomes et des molécules dans le temps, est un défi central en chimie computationnelle. Traditionnellement, les chercheurs intègrent des biais inductifs, tels que l'équivariance qui garantit que les forces prédites restent cohérentes quelle que soit l'orientation de la molécule, et la conservation stricte de l'énergie, pour assurer la fiabilité physique des simulations. Cette nouvelle recherche interroge l'indispensabilité de ces contraintes rigides. Le modèle MD-ET a été entraîné sur environ 30 millions de structures moléculaires issues de la base de données QCML, développée en collaboration entre le BIFOLD et Google DeepMind. L'objectif était de vérifier si une architecture générale, sans codage dur de lois physiques, pouvait approximer ces comportements complexes par l'apprentissage profond. Les résultats sont prometteurs pour de nombreuses applications pratiques. Sur plusieurs benchmarks établis, le modèle atteint des performances compétitives voire de l'état de l'art. Il apprend à prédire des forces approximativement équivariantes, avec des écarts négligeables par rapport aux normes physiques. De plus, des simulations dans un ensemble canonique (NVT), où la température et le nombre de particules sont constants, réussissent même avec un nombre limité d'exemples d'entraînement. Les auteurs attribuent ce succès à la taille considérable des données pré-entraînées et à la facilité d'optimisation des transformateurs par rapport aux modèles spécialisés plus complexes. Cependant, l'étude met en lumière des limites spécifiques. Pour les simulations dans un ensemble microcanonique (NVE), où l'énergie totale du système doit rester strictement constante sans thermostat, le modèle montre des signes de fragilité. Bien que la conservation de l'énergie soit approximativement apprise, elle devient sensible à la taille des molécules et aux perturbations numériques. Pour les structures plus grandes, le modèle présente des augmentations incontrôlées de l'énergie, un phénomène connu sous le nom de divergence énergétique. Les chercheurs sont honnêtes sur ce point, indiquant que les simulations utilisant des forces non conservatrices doivent être validées au cas par cas avec une grande rigueur. Cette recherche contribue de manière significative au débat actuel au sein de la communauté scientifique. Elle suggère que pour de nombreuses applications, des architectures générales puissantes et entraînées sur de grands volumes de données peuvent apprendre à respecter les principes physiques sans contraintes explicites. Toutefois, elle précise également les frontières actuelles de cette approche, soulignant que la suppression des biais physiques ne résout pas tous les problèmes de stabilité énergétique. L'étude ouvre ainsi la voie à des modèles plus flexibles et potentiellement plus efficaces, tout en rappelant la prudence nécessaire lors de leur utilisation pour des simulations à très haute précision énergétique.
