Le "Panduan·Modèle de base scientifique" dévoilé par l'Académie chinoise des sciences, révolutionne la recherche avec l'intelligence artificielle
Le « Pinnacle · Grand Modèle de Base en Sciences » a été officiellement lancé lors de la Conférence mondiale sur l'intelligence artificielle en 2025. Ce modèle, développé par une équipe conjointe du Chinese Academy of Sciences, marque une avancée majeure dans l'application de l'intelligence artificielle au domaine scientifique. En transformant les fondamentaux de la recherche, il accélère la découverte scientifique et offre de nouvelles opportunités pour relever des défis technologiques majeurs. Conçu à partir de données et de connaissances scientifiques spécifiques, ce grand modèle de base permet une compréhension approfondie de divers types de données scientifiques tels que les ondes, les spectres et les champs. Il intègre des capacités clés comme l'extraction et la fusion de la littérature scientifique, la représentation et la raisonnement des connaissances scientifiques, ainsi que la planification et l'ordonnancement des outils scientifiques. Son objectif est de fournir un soutien intelligent fiable pour l'innovation dans tous les domaines scientifiques. Actuellement, le développement de l'IA en sciences repose souvent sur l'adaptation de grands modèles généraux aux données spécifiques d'un domaine, ou sur la création d'outils spécialisés. Cette approche génère des défis tels que l'isolement des données scientifiques, un manque de compétences de raisonnement spécialisées, et un écosystème de recherche fermé. Pour répondre à ces problèmes, l'équipe de recherche du Chinese Academy of Sciences a exploité ses atouts : son écosystème complet en sciences naturelles, sa chaîne d'innovation en IA à l'échelle complète, ainsi que ses infrastructures scientifiques et ses données. Cela a permis de construire un nouveau modèle, capable de gérer les données et les modèles, et de coordonner les outils de calcul et de simulation. Il s'agit d'un véritable « système d'exploitation » pour l'IA appliquée aux sciences, permettant aux chercheurs d'intégrer l'IA de manière naturelle à chaque étape de leur travail. Le modèle repose sur une architecture hybride de experts, qui a été adaptée de manière approfondie à partir d'un modèle open source national, en intégrant une série de modèles spécialisés pour les données scientifiques. Il a également incorporé des modèles de pointe tels qu'AlphaFold et MatterGen. En termes de compétences scientifiques, il maîtrise les principes fondamentaux des six grandes disciplines scientifiques : mathématiques, physique, chimie, astronomie, géologie et biologie. Des tests récents ont montré qu'il atteint des performances exceptionnelles dans des ensembles de données internationaux, notamment dans les domaines de la mathématique, de la physique, de la chimie et de la biologie. Il a également démontré une excellente capacité de raisonnement scientifique et d'utilisation d'outils, avec des résultats solides dans des tests comme GAIA et SimpleQA. En parallèle, l'équipe a développé deux agents intelligents : « Pinnacle · Bibliothèque des Publications » et « Pinnacle · Tableau de Gestion des Outils ». Le premier permet aux chercheurs de lire et d'analyser rapidement des milliers de publications, réduisant le temps de recherche de plusieurs jours à seulement 20 minutes. Le second simplifie l'utilisation des outils de calcul scientifique, permettant de planifier automatiquement et de coordonner efficacement plus de 300 outils, optimisant ainsi les processus de recherche. Ce modèle a déjà été appliqué dans plusieurs domaines. En biologie, il a permis le développement de X-Cell, un modèle de cellule numérique, accélérant le processus de découverte de cibles thérapeutiques de plus de 10 fois. En physique des particules, il a facilité la planification des tâches de recherche au Beijing Electron-Positron Collider. En mécanique, il a permis des calculs précis de la répartition de pression sur les modèles de TGV, soutenant ainsi leur conception. De plus, il améliore l'efficacité des expériences chimiques et la précision des prédictions moléculaires, tout en optimisant l'analyse des données astronomiques. Le Chinese Academy of Sciences a lancé le projet « Alliance de l'Écosystème du Grand Modèle de Base en Sciences », rassemblant plus de quarante institutions, universités et entreprises, afin de promouvoir une coopération innovante et de construire un écosystème ouvert, autonome et contrôlé. Le modèle est désormais disponible en open source, et les chercheurs sont invités à le tester via le site officiel.