Modèles IA fondés sur la physique accélèrent les découvertes scientifiques
Des modèles d’intelligence artificielle traditionnels comme ChatGPT sont formés sur des textes ou des images, mais une équipe multidisciplinaire du consortium Polymathic AI, incluant des chercheurs de l’Université de Cambridge, développe désormais des modèles fondamentaux spécifiquement entraînés sur des données scientifiques réelles. Ces nouveaux modèles, Walrus et AION-1, sont conçus pour apprendre les principes physiques universels à partir de vastes ensembles de données provenant de domaines très variés, permettant ainsi une généralisation transversale entre disciplines. Contrairement aux modèles classiques qui s’adaptent à un problème spécifique, ces fondations modèles captent les lois sous-jacentes des systèmes physiques, rendant leurs connaissances applicables à des contextes apparemment très éloignés. Walrus, développé par Michael McCabe, est spécialisé dans les systèmes fluides et fluides apparentés. Il s’appuie sur le Well, une base de données massive de 15 téraoctets regroupant 19 scénarios et 63 domaines différents de dynamique des fluides — allant des étoiles à neutron en fusion aux ondes acoustiques ou aux couches atmosphériques terrestres. Grâce à cette formation, Walrus peut prédire l’évolution d’un système à partir d’un court enchaînement de snapshots, même dans des cas peu familiers, comme les signaux Wi-Fi ou le mouvement de bactéries. Son succès démontre que des principes physiques communs peuvent être exploités au-delà des frontières disciplinaires. AION-1, quant à lui, est entraîné sur des données astronomiques provenant de grands relevés comme le Sloan Digital Sky Survey (SDSS) et Gaia, totalisant plus de 200 millions d’observations d’étoiles, quasars et galaxies, soit environ 100 téraoctets. Il apprend à comprendre les propriétés physiques des objets célestes à partir d’images, de spectres et de mesures diverses. Lorsqu’un chercheur obtient une image de faible résolution d’une galaxie, AION-1 peut extrapoler des informations détaillées en s’appuyant sur les connaissances acquises à partir de millions d’autres galaxies. Ces modèles fonctionnent comme nos sens combinés : en intégrant plusieurs types d’informations, ils peuvent inférer des données manquantes, comme un humain qui devine le goût d’un aliment à partir de son apparence. « C’est comme rencontrer un nouvel ami après avoir connu des centaines de personnes », explique Shirley Ho, chef du projet. « Vous avez déjà une représentation mentale de ce à quoi il pourrait ressembler. » Les modèles fondamentaux comme Walrus et AION-1 offrent plusieurs avantages : ils accélèrent les calculs, fonctionnent bien avec de petits jeux de données, et permettent de découvrir des lois physiques partagées entre des domaines différents. Leur code et leurs données sont open source, incitant la communauté scientifique à les adapter et à les enrichir. L’objectif est de fournir des outils puissants et accessibles aux chercheurs, leur permettant de démarrer des projets avec une base d’intelligence pré-entraînée, sans reconstruire des pipelines complexes à chaque fois. « Nous voulons ramener cette intelligence artificielle là où elle est nécessaire : dans les laboratoires et les observatoires », affirme Ho. Ces avancées marquent une étape vers une IA généraliste pour la simulation physique, capable de transformer la recherche scientifique en rendant l’exploration des lois de la nature plus rapide, plus efficace et plus collaborative.
