IA : désapprendre la physique
Une étude publiée dans le Journal of Cosmology and Astroparticle Physics examine l'utilisation de l'apprentissage par transfert en intelligence artificielle pour accélérer la recherche de nouvelles physiques au-delà du modèle cosmologique standard, dit ΛCDM. Bien que ce modèle décrive avec succès l'expansion de l'univers et la répartition des galaxies, il est probablement incomplet. Des indices récents suggèrent l'existence de neutrinos massifs, d'une gravité modifiée ou d'une énergie noire évolutive. Tester ces hypothèses nécessite traditionnellement d'immenses ressources de calcul pour simuler des univers virtuels. Les chercheurs Adrian Bayer, du Flatiron Institute et de l'université de Princeton, et Veena Krishnaraj, étudiante à Princeton, ont testé une approche efficace : l'apprentissage par transfert. Il s'agit d'entraîner d'abord un réseau de neurones sur des simulations ΛCDM simples et peu coûteuses, puis de l'adapter à des modèles plus complexes intégrant ces nouvelles physiques. Comme le compare Bayer, c'est l'équivalent d'étudier un sujet complexe grâce à un manuel d'introduction avant de passer à des ouvrages avancés. Cette méthode évite de surcharger l'intelligence artificielle et permet, dans certains cas, de diviser par plus de dix le nombre de simulations coûteuses nécessaires. Toutefois, l'étude met en lumière un risque majeur : le transfert négatif. Lorsqu'un phénomène physique inédit produit des signatures visuellement similaires à celles du modèle standard, l'IA a tendance à interpréter ces données à travers le prisme de ses connaissances préalables. Les auteurs ont observé ce phénomène avec les neutrinos massifs, dont les effets ressemblent de près aux variations du paramètre σ8, qui décrit la concentration de la matière. Cette confusion n'est pas aléatoire ; elle découle de dégénérescences physiques intrinsèques au modèle. La reconnaissance de véritables innovations théoriques s'en trouve ainsi entravée. Ces travaux, bien qu'actuellement limités à des simulations, posent les bases d'une intégration future aux données observationnelles réelles. Ils illustrent à la fois le potentiel et les écueils des modèles d'IA généraliste appliqués à la physique fondamentale. Si l'apprentissage par transfert accélère considérablement les calculs, il impose de développer des mécanismes de vigilance pour éviter que l'IA ne s'ankyrose dans ses préconceptions. À mesure que les futurs relevés cosmologiques généreront des volumes de données sans précédent, cette approche pourrait devenir un outil indispensable, à condition de maîtriser ses limites.
