L'équipe AI4S De L'université Jiao Tong De Shanghai a Proposé Le Concept D'« Installations Scientifiques Intelligentes » Pour Établir Un Assistant De Recherche Interdisciplinaire En IA.

Français Ces dernières années, l'application de l'intelligence artificielle dans la recherche scientifique a continué à se développer en profondeur, tout en élargissant l'étendue de ses domaines d'application, du repliement des protéines à la découverte de nouveaux matériaux, de la prédiction des maladies au pronostic et au traitement, de l'exploration astronomique à l'analyse des catastrophes naturelles... Derrière l'épanouissement de l'IA pour la science, d'une part, les entreprises d'IA nationales et étrangères ont mené des recherches et développements dans le domaine de la recherche scientifique, ce qui a abaissé le seuil d'utilisation des outils d'IA ; d'autre part, dans le processus d'acceptation des « assistants IA », les chercheurs scientifiques ont développé un modèle de collaboration efficace avec eux.
Une analyse de Nature montre que dans la base de données Scopus, la proportion d'articles mentionnant l'intelligence artificielle ou des mots-clés liés à l'intelligence artificielle dans le titre ou le résumé est passée de 2% il y a dix ans à 8% aujourd'hui. Cependant, en examinant les grands modèles et autres outils publiés par les géants de la technologie représentés par Google DeepMind, ainsi que les résultats de recherche connexes publiés par des équipes de recherche d'universités nationales et étrangères, la plupart d'entre eux visent des problèmes spécifiques dans des domaines spécifiques et manquent de reproductibilité.
Le professeur Lin Zhouchen, de l'École d'intelligence de l'Université de Pékin, a déclaré dans une interview accordée à HyperAI : « Les outils d'IA actuels manquent d'uniformité. Même en se concentrant uniquement sur les mathématiques, il existe déjà de grandes différences entre les outils d'IA développés pour la théorie des nombres et la géométrie, sans parler des outils d'IA interdisciplinaires. Les outils d'IA ne sont pas encore devenus une base fondamentale comme les ordinateurs d'aujourd'hui, auxquels on peut facilement accéder. Les langages informatiques actuels incluent C, Java, Python, etc., et il est tout à fait possible de résoudre des problèmes dans de multiples disciplines telles que les mathématiques, la physique et la chimie à partir de n'importe lequel de ces langages, ce qui témoigne de leur polyvalence. Cependant, ce n'est pas le cas des outils d'IA. Il suffit de consulter la série Alpha de Google DeepMind pour s'en rendre compte. »
Compte tenu de cela,Le professeur Yang Xiaokang et d'autres membres de l'équipe AI for Science de l'Institut d'intelligence artificielle de l'Université Jiao Tong de Shanghai ont proposé un concept pour la construction d'installations scientifiques intelligentes.Il forme des fonctions innovantes telles que des modèles de grande taille dans les domaines scientifiques, la simulation générative et l'inversion, des expériences autonomes intelligentes sans pilote et une collaboration de recherche scientifique de confiance à grande échelle. Les résultats de recherches connexes ont été publiés dansBulletin de l'Académie chinoise des sciences》.

Adresse du document :
http://www.bulletin.cas.cn/previewFile?id=52965146&type=pdf&lang=zh
Suivez le compte officiel et répondez « AI4S » pour obtenir l'article complet
Équilibrer l'innovation et l'autonomisation
L'équipe d'IA pour la science de l'Université Jiao Tong de Shanghai a proposé que pour parvenir à l'innovation fondamentale de la science fondamentale et à l'innovation technologique majeure en aval à l'ère de l'intelligence, deux problèmes fondamentaux doivent être résolus de toute urgence :
*Comment construire une nouvelle installation d’intelligence scientifique basée sur le paradigme de recherche de l’IA pour la science ?
*Comment utiliser la nouvelle génération d’IA pour renforcer les installations scientifiques traditionnelles ?

En termes d’innovation,Il est nécessaire de libérer systématiquement et de manière holistique la créativité et la polyvalence de la nouvelle génération d’IA (en particulier l’IA générative et les grands modèles) dans le domaine des sciences fondamentales, de réaliser des fonctions innovantes telles que la génération spontanée d’hypothèses, la déduction automatique de lois, les expériences autonomes sans pilote et la collaboration de confiance auto-pilotée, et de promouvoir l’exploration scientifique itérative à très grande échelle et à grande vitesse.
Dans le cadre des installations scientifiques et des paradigmes de recherche traditionnels,L’ensemble du processus de recherche scientifique présente des difficultés telles que la difficulté de communiquer des questions scientifiques, la difficulté de mener des expériences scientifiques et la difficulté de partager des données scientifiques. Ces difficultés sont particulièrement importantes dans certaines installations scientifiques de haute technologie à grande échelle et dans leurs environnements de recherche scientifique extrêmement complexes. L'utilisation de la nouvelle génération d'IA pour réaliser une boucle fermée efficace de « problèmes scientifiques (scientifiques) - équipements expérimentaux (expérimentateurs) - données et littérature de recherche scientifique (institutions de recherche scientifique et intermédiaires) » n'est pas seulement une caractéristique standard des installations scientifiques nouvellement construites, mais aussi une nouvelle demande et une nouvelle opportunité dans le processus de modernisation et de rénovation des installations scientifiques existantes.
Par conséquent, l'idée de l'équipe de construire une « installation scientifique basée sur l'IA » (AISF) prend en compte deux aspects : « créer de nouvelles installations scientifiques hautement intelligentes » et « autonomiser les grandes installations scientifiques existantes ».

Comme le montre la figure ci-dessus, les installations scientifiques intelligentes forment une architecture à trois niveaux d’installations scientifiques intelligentes avec des personnes impliquées dans la boucle.
*Couche de support de base, grâce à un réseau de calcul et de puissance de calcul haute performance, pour former un support de puissance de calcul ;
*Couche de modèle scientifique, construire des modèles scientifiques interdisciplinaires et transmodaux et des « assistants de recherche en IA » ;
* Couche d'application expérimentaleGrâce à des robots pilotés par l'IA et à des environnements expérimentaux intelligents, des expériences autonomes sans pilote et une collaboration de recherche scientifique multipartite peuvent être réalisées.
4 fonctionnalités innovantes
Sur la base de l'architecture à trois couches, les installations scientifiques intelligentes peuvent former quatre nouvelles fonctions majeures que le paradigme traditionnel n'a pas, à savoir, les grands modèles scientifiques, la simulation et l'inversion génératives, les expériences autonomes sans pilote à haut débit et la collaboration de recherche scientifique de confiance à grande échelle.

Modèle scientifique
En tant qu'« assistant IA » pour aider les scientifiques humains à mener des recherches scientifiques, le grand modèle scientifique doit avoir une base de connaissances interdisciplinaires, être capable de traiter des entrées de données intermodales, maîtriser la capacité d'appeler des outils scientifiques externes et combiner rétroaction et évaluation pour parvenir à une évolution continue.

Comme le montre la figure ci-dessus, la construction d’un grand modèle scientifique nécessite la formation de quatre capacités spécialisées en plus du grand modèle de langage de base et la construction de repères d’évaluation correspondants.
La première est la capacité d’unifier les apports entre les disciplines et les modalités.Les données générées par la recherche scientifique comprennent généralement des données multimodales telles que des formules, des graphiques et des formules moléculaires en plus des données textuelles. Comment parvenir à une saisie unifiée de ces données intermodales et modéliser ensuite conjointement les connaissances professionnelles interdisciplinaires est un problème difficile qui doit être résolu de toute urgence en établissant un grand modèle scientifique.
La deuxième est la capacité à faire appel efficacement à des outils scientifiques externes.Les grands modèles ont le problème de produire un contenu apparemment raisonnable mais en réalité erroné. Une approche technique réalisable pour résoudre ce problème consiste à utiliser de grands modèles comme moteurs de planification et de raisonnement, et à améliorer la crédibilité et la précision en faisant appel à différents types d’outils scientifiques externes.
Le troisième est la capacité du modèle à réagir et à évoluer en permanence.D'une part, les grands modèles scientifiques peuvent utiliser les commentaires de haute qualité des chercheurs pour améliorer les connaissances professionnelles dans le domaine scientifique, renforcer la capacité à modéliser et à déduire les connaissances scientifiques et améliorer le niveau de génération de contenu scientifique, d'induction de la littérature et de raisonnement. D’autre part, ils peuvent utiliser le retour d’expérience pour améliorer continuellement leur capacité à générer des hypothèses scientifiques et à optimiser les plans expérimentaux.
Le quatrième est l'illusion (Hallucination) Capacité d'élimination.L'hallucination fait référence au phénomène selon lequel le contenu généré par un modèle est incompatible avec les faits du monde réel ou les entrées de l'utilisateur. La manière de filtrer efficacement les connaissances des experts et d’utiliser une expertise de haute précision pour l’apprentissage par renforcement afin de réaliser l’itération et la mise à jour de grands modèles est une méthode importante pour éliminer les illusions scientifiques. En outre, l’optimisation ciblée et l’intégration basées sur le modèle de base pour améliorer la crédibilité et la précision du modèle dans des domaines spécifiques constituent également un moyen important de corriger les illusions scientifiques.
enfin,Le benchmark d'évaluation des grands modèles scientifiques teste les capacités de compréhension et de modélisation des données intermodales et interdisciplinaires des grands modèles scientifiques d'une part ; d'autre part, il évalue si les grands modèles scientifiques ont la capacité d'utiliser des outils scientifiques pour réaliser avec précision et robustesse des tâches complexes, et s'ils ont une forte capacité à refuser de générer du contenu faux et nuisible.
Simulation générative et inversion
L’utilisation de la simulation et des outils de simulation informatique pour réaliser la déduction entre « théorie-phénomène » est l’un des paradigmes importants de la recherche scientifique. Les méthodes de simulation traditionnelles basées sur des calculs numériques présentent des limites et des défis en termes de vitesse de résolution et de précision dans de nombreux scénarios réels.

Simulation générative et inversion de l'espace de simulation
Comme le montre la figure ci-dessus, le réseau neuronal génératif est la structure de base.Le problème de la résolution numérique de systèmes complexes peut être transformé en un problème d’ajustement de données.Une cartographie efficace de l'espace d'hypothèses à l'espace de simulation est établie pour accélérer la solution. De plus, la technologie de rendu génératif peut également réaliser la génération de représentations de phénomènes scientifiques de l'espace de simulation à l'espace d'observation, puis réaliser un apprentissage en boucle fermée à travers les trois espaces « hypothèse-simulation-observation » pour piloter l'inversion des lois.
Système expérimental autonome et intelligent sans pilote
Le système d'expérimentation autonome intelligent sans pilote vise à combiner les réalisations technologiques dans les domaines de l'IA et de la robotique avec des expériences scientifiques, et à améliorer l'efficacité et la réutilisabilité des expériences grâce à des processus expérimentaux sans pilote, standardisés et à grande échelle.

Parmi elles, le flux de tâches de la plate-forme d'opération expérimentale sans pilote et du système intelligent comprend principalement trois étapes :
*Optimisation automatique des solutions
*Planification de mission autonome
*Opération expérimentale sans pilote
En même temps, en fonction de la précision de l'opération,Les opérations expérimentales sans pilote peuvent être divisées en deux échelles spatiales : microscopique et macroscopique.Les objets des expériences sans pilote à l’échelle microscopique sont généralement de minuscules particules telles que des cellules vivantes et des protéines, et des plates-formes expérimentales fixes sont souvent utilisées. L’enjeu principal est d’améliorer le rendement des opérations de haute précision. Les opérations expérimentales sans pilote à grande échelle se concentrent sur l'exhaustivité du processus expérimental, en utilisant principalement des robots mobiles équipés de bras robotisés pour se déplacer de manière autonome entre les équipements expérimentaux afin de réaliser des expériences automatisées multitâches à processus complet.
De plus, sur la base de la plate-forme matérielle, la création d'un logiciel système intelligent est un autre problème fondamental de la plate-forme expérimentale autonome intelligente sans pilote. Le logiciel pilote les processus de perception de l'état de soi, de perception de l'environnement externe, de navigation mobile, de positionnement des instruments, de planification des opérations expérimentales et d'exécution du contrôle. L'apprentissage par renforcement profond et l'apprentissage par imitation peuvent conduire à un apprentissage autonome à travers la trajectoire d'expérience de l'interaction environnementale ou la trajectoire d'enseignement expert, et construire une relation de cartographie entre les informations d'observation et les actions optimales.
Collaboration de recherche scientifique à grande échelle
Les installations scientifiques intelligentes soutiennent le partage de données pour faciliter le développement et le test de modèles d’IA, mais une série de mesures doivent être conçues pour identifier et protéger les droits de propriété intellectuelle et les intérêts des développeurs de données. Ces dernières années, la science décentralisée (DeSci) a attiré beaucoup d’attention de la part des chercheurs. DeSci vise à utiliser les outils Web3, notamment les contrats intelligents et la blockchain, pour résoudre les problèmes de propriété intellectuelle dans la recherche scientifique et promouvoir le partage et la circulation des données scientifiques.
Dans l'architecture de l'installation scientifique intelligente proposée par l'équipe de recherche,La technologie Blockchain fournit la base pour créer un environnement collaboratif sécurisé et fiable. La technologie d’apprentissage fédéré peut résoudre le problème de l’îlot de données dans un environnement collaboratif décentralisé et garantir la sécurité des données et l’efficacité de la recherche scientifique. L'intelligence collective d'Internet peut intégrer différents modules de recherche scientifique dans une plate-forme unifiée pour parvenir à une collaboration efficace en matière de recherche scientifique à grande échelle.

Pratiquer et promouvoir le développement de l'IA pour la science
En tant que première étape de la mise en œuvre du concept d'installations scientifiques intelligentes, l'Université Jiao Tong de Shanghai a construit la plate-forme ouverte de données scientifiques AI for Science, qui comprend quatre sous-plateformes : base de puissance de calcul scientifique, données scientifiques, intelligence artificielle et collaboration scientifique. Sur la base de cette plateforme, elle a développé le « Magnolia Science Model » et publié les versions 1.0 et 2.0 en juillet et décembre 2023, respectivement, couvrant la chimie, les fluides, le droit, les repères d'évaluation interscientifiques et d'autres domaines.
dans,Le « Magnolia Science Model 2.0 » publié il y a peu inclut « Open Source Law (BAI-Law-13B) » et « Chemical Synthesis 2.0 (BAI-Chem 2.0) ».
BAI-Law-13B a subi une pré-formation de domaine en utilisant des quantités massives de données faisant autorité provenant de l'Internet chinois, de codes open source, de documents judiciaires, de documents juridiques et de livres juridiques pour former le modèle BAI-Law-13B-Base. Sur cette base, il a intégré la supervision et le réglage fin des scénarios d'application judiciaire tels que la mémoire des connaissances juridiques, la compréhension des connaissances juridiques et l'application des connaissances juridiques pour former le modèle BAI-Law-13B-SFT. Il est rapporté que dans le référentiel d'évaluation juridique complète par un tiers LawBench Lors du test, il a surpassé tous les grands modèles généraux chinois open source et les grands modèles juridiques chinois.
BAI-Chem 2.0 peut réaliser une conception rapide et efficace de molécules médicamenteuses et peut concevoir 30 molécules de type médicament à haute affinité pour la cible par seconde ; la précision de la rétrosynthèse en une seule étape Top1 sur l'ensemble de données publiques de l'ensemble de tests USPTO est améliorée de 15% par rapport aux meilleures actuelles de la littérature. La prédiction de rendement R² pour les données expérimentales à haut débit a atteint 0,88 ; la précision de recommandation du catalyseur a atteint 93,7%. À l'heure actuelle, BAI-Chem 2.0 a efficacement connecté la vérification des expériences humides, réalisé l'optimisation expérimentale en ligne et amélioré rapidement l'efficacité des expériences chimiques.
L’attention précoce accordée à l’IA pour la science et la création d’une équipe de recherche correspondante suffisent à montrer l’importance que l’Université Jiao Tong de Shanghai attache à l’IA4S, une application de pointe de l’IA. À l’heure actuelle, l’équipe a non seulement produit des résultats pertinents, mais a également continué à coopérer avec des entreprises concernées. On pense que dans un avenir proche, la collaboration interdisciplinaire et basée sur une plateforme dans le cadre du « concept d’installation scientifique intelligente » sera véritablement réalisée.
Références :
1.https://news.sjtu.edu.cn/jdzh/20240124/193351.html
2.https://cloud.baidu.com/news/news_85aaa2be-241d-45c2-8aa1-3c8bbcfbd09b