【ScienceAI Weekly】La Nouvelle Puce IA D'ibm Améliore L'efficacité De 25 Fois ; L’Université Tsinghua Publie Un Cadre Assisté Par L’ia ; Le Nouvel Outil De DeepMind Prédit 2,2 Millions De Nouveaux Cristaux

« ScienceAI Weekly » est une chronique bimestrielle nouvellement créée par HyperAI. Il rassemble et présente principalement les derniers développements dans le domaine de ScienceAI qui méritent d'être pris en compte dans un avenir proche à partir de quatre dimensions : les résultats de la recherche scientifique, la dynamique d'entreprise, les ressources en outils et les activités récentes. Il espère fournir des informations privilégiées plus précieuses et une inspiration industrielle aux praticiens et aux passionnés qui s'intéressent à ce domaine depuis longtemps.
Jetons un œil aux progrès de ScienceAI qui méritent d’être soulignés dans ce numéro !
Résultats de la recherche
GaUDI : un modèle de diffusion guidée pour la conception moléculaire inverse

* Titre:Diffusion guidée pour la conception moléculaire inverse
* Source:Nature Science Computationnelle
* champConception moléculaire, chimie des matériaux
* auteur:L'Institut de technologie Technion-Israël et l'Université Ca' Foscari de Venise
* Texte original :
https://www.nature.com/articles/s43588-023-00532-0
Description de la méthode :
GaUDI est un modèle de diffusion guidée pour la conception moléculaire inverse. Il combine un réseau neuronal graphique équivariant pour la prédiction de propriétés avec un modèle de diffusion générative. En utilisant la détection de tâches à cible unique et à cibles multiples sur un ensemble de données de 475 000 systèmes aromatiques polycycliques, les chercheurs ont découvert que GaUDI est extrêmement efficace dans la conception moléculaire pour les applications électroniques organiques.
GaUDI améliore la conception conditionnelle pour générer des molécules avec des propriétés optimales, même au-delà de la distribution d'origine, et peut identifier les molécules supérieures à celles de l'ensemble de données. En plus des cibles ponctuelles, GaUDI peut également être utilisé pour des cibles ouvertes (telles que minimum ou maximum), et dans tous les cas, les molécules générées ont une validité proche de 100%.
SurfGen : un nouveau modèle de découverte de médicaments assistée par ordinateur

* Titre:Apprentissage sur la surface topologique et la structure géométrique pour la génération moléculaire 3D
* Source:Nature Science Computationnelle
* Champ:Conception moléculaire, découverte de médicaments
* auteur:Université du Zhejiang et équipe de recherche Carbon Silicon Intelligence
* Texte original :
https://www.nature.com/articles/s43588-023-00530-2
Description de la méthode :
Le modèle SurfGen conçoit des molécules d'une manière similaire au principe « clé et serrure ». Il contient deux réseaux neuronaux équivariants - Geodesic-GNN et Geoatom-GNN, qui capturent respectivement les interactions topologiques sur la surface de la poche et les interactions spatiales entre les atomes ligands et les nœuds de surface.
SurfGen surpasse les autres méthodes sur de nombreux critères de référence et présente une sensibilité élevée à la structure des poches, ce qui permet des approches basées sur des modèles génératifs pour résoudre le problème épineux de la résistance aux médicaments induite par les mutations.
Une équipe de recherche de l'Université Tsinghua publie un cadre assisté par l'IA - DeepSEED

* Titre:
Ingénierie de séquences flanquantes profondes pour une conception efficace des promoteurs à l'aide de DeepSEED
* Source:Nature Communications
* Champ:Biologie synthétique
* auteur:Équipe de recherche de l'Université Tsinghua
* Texte original :
https://www.nature.com/articles/s41467-023-41899-y
Description de la méthode :
DeepSEED se compose de deux modules d'apprentissage profond : un réseau antagoniste génératif conditionnel (cGAN) pour capturer les dépendances entre les modèles explicites et implicites, et un modèle de prédiction basé sur DenseNet-LSTM pour évaluer les performances du promoteur. Les deux modèles sont couplés à l’aide d’un algorithme génétique pour obtenir la conception optimale de promoteurs fonctionnels grâce à l’itération du modèle.
FIREANN : Un modèle général d'apprentissage automatique pour la réponse des systèmes atomiques aux champs externes

* Titre:
Apprentissage automatique universel pour la réponse des systèmes atomiques aux champs externes
* Source:Nature Communications
* Champ:Systèmes atomiques, apprentissage automatique
* auteur:Équipe de l'Université des sciences et technologies de Chine et de l'Université des sciences et technologies d'Anhui
* Texte original :
https://www.nature.com/articles/s41467-023-42148-y
Description de la méthode :
L'équipe de recherche a proposé un modèle général de réseau neuronal atomique récursif induit par le champ (FIREANN) qui peut intégrer des caractéristiques dépendantes du vecteur de pseudo-champ dans des descripteurs atomiques pour représenter les interactions système-champ avec une équivariance rotationnelle stricte.
Cette approche « tout-en-un » relie diverses propriétés de réponse telles que le moment dipolaire et la polarisabilité au potentiel dépendant du champ dans un seul modèle et est bien adaptée aux simulations spectroscopiques et dynamiques de molécules et de systèmes périodiques en présence de champs électriques. Pour les systèmes périodiques, FIREANN peut surmonter le problème intrinsèque à valeurs multiples de la polarisation en entraînant uniquement les forces atomiques.
Actualités de l'entreprise
DeepMind lance GNoME, utilisant l'apprentissage profond pour prédire 2,2 millions de nouveaux cristaux

Diagramme de processus GNoME
Google DeepMind Un article récemment publié dans Nature a montré qu'avec l'aide de son outil d'apprentissage profond GNoME, les chercheurs ont découvert 2,2 millions de nouveaux cristaux en peu de temps (équivalent à près de 800 ans de connaissances accumulées par les scientifiques humains), dont 380 000 nouveaux cristaux ont des structures stables, devenant ainsi les nouveaux matériaux potentiels les plus susceptibles d'être synthétisés par des expériences et mis en service.
GNoME, dont le nom complet est Graph Networks for Materials Exploration, est un modèle SOTA GNN pour la recherche et le développement de nouveaux matériaux. Il utilise l’apprentissage profond pour prédire la stabilité de nouveaux matériaux en très peu de temps, améliorant considérablement la vitesse et l’efficacité de la recherche et du développement de matériaux, et démontrant le potentiel de l’utilisation de l’IA pour développer de nouveaux matériaux à grande échelle.
DeepMind lance GraphCast, un modèle d'IA de prévision météorologique

GraphCast peut prédire la météo pour les 6 prochaines heures en fonction des conditions météorologiques actuelles et précédentes.
Récemment, Google DeepMind a annoncé sur son blog officiel le lancement d'un modèle de prévision météorologique basé sur l'apprentissage automatique - GraphCast, qui peut prédire des centaines de variables météorologiques pour les 10 prochains jours en une minute à une résolution globale de 0,25°, surpassant considérablement les méthodes de prévision météorologique traditionnelles.
De plus, le modèle est également performant dans la prévision des événements extrêmes. Comparé au système de simulation météorologique de référence de l'industrie, High Resolution Forecasting (HRES), GraphCast a prédit avec précision plus de 90% sur 1 380 variables testées.
Biopharma et Sanofi concluent une coopération stratégique à grande échelle
BioMap a annoncé un partenariat stratégique avec Sanofi, l'une des 10 plus grandes multinationales pharmaceutiques au monde. Selon l'accord, les deux parties développeront conjointement des modèles de pointe pour la découverte de médicaments biothérapeutiques basés sur le modèle de base de l'IA en sciences de la vie de Baidu Bio. Cette coopération est la première coopération commerciale basée sur de grands modèles dans le domaine des sciences de la vie. Il favorise également le développement parallèle des deux modèles commerciaux de « développement de modèles » et de « développement de pipelines de médicaments basés sur l'IA ».
IBM lance une nouvelle puce d'IA NorthPole, 25 fois plus économe en énergie

Il y a quelque temps, IBM aux États-Unis a lancé une puce d'IA semblable à un cerveau, NorthPole, qui peut considérablement améliorer l'efficacité énergétique, spatiale et temporelle. L’article pertinent a été publié dans la revue internationale de renom Nature. Il est rapporté que NorthPole est construit sur la base d'une technologie de traitement de nœuds de 12 nm. En prenant le modèle ResNet-50 comme référence, l'efficacité de NorthPole est nettement supérieure à celle du GPU 12 nm et du CPU 14 nm courants, et son efficacité énergétique est améliorée de 25 fois.
Adresse du document :
https://www.nature.com/articles/d41586-023-03267-0
Xuanyan Biotech lève des dizaines de millions de dollars grâce à un financement providentiel
Shanghai Xuanyan Biotechnology Co., Ltd. a annoncé précédemment la finalisation d'un tour de financement providentiel de plusieurs dizaines de millions de yuans, mené exclusivement par Hainan Qianganghui Investment Partnership. Les fonds levés seront utilisés pour la recherche préclinique sur INTX-001, un nouveau médicament à base d'anticorps ciblant le cancer, le développement de pipelines IVD en aval et la prédiction basée sur l'IA des produits et logiciels IVD liés à la progression des principales maladies (dépistage précoce, métastases, etc.).
Outils et ressources
IAou la science L'équipe principale du nouveau projet open source Polymathic AI est dévoilée

L’objectif du programme Polymathic AI est d’accélérer le développement de modèles fondamentaux polyvalents adaptés aux ensembles de données numériques et aux tâches d’apprentissage automatique scientifique.
À cette fin, Polymathic AI a réuni une équipe de chercheurs en apprentissage automatique et de scientifiques du domaine, guidés par un groupe consultatif scientifique composé d'experts de renommée mondiale, conseillés par Yann LeCun, lauréat du prix Turing et scientifique en chef de Meta, et soutenus par un certain nombre de poids lourds universitaires, dont Miles Cranmer, professeur adjoint d'IA + astronomie / physique à l'Université de Cambridge, afin de se concentrer sur le développement de modèles de base pour les données scientifiques et d'utiliser des concepts partagés interdisciplinaires pour résoudre les défis de l'industrie en matière d'IA pour la science.
Adresse open source du projet :
https://github.com/PolymathicAI/
L'Académie Alibaba Damo publie un grand modèle d'IA de télédétection

Il n'y a pas longtemps, Alibaba Damo Academy a publié le premier grand modèle d'IA de télédétection du secteur (AIE-SEG), qui a été le premier à réaliser l'unification des tâches de segmentation d'images dans le domaine de la télédétection. Il peut réaliser l'extraction rapide d'« échantillons zéro de toutes choses », identifier près de 100 types de classifications d'objets terrestres de télédétection tels que les terres agricoles, l'eau et les bâtiments, et ajuster automatiquement les résultats de reconnaissance en fonction des commentaires interactifs de l'utilisateur, améliorant considérablement l'efficacité d'analyse des applications de télédétection telles que la prévention et le contrôle des catastrophes, la gestion des ressources naturelles et l'estimation de la production agricole.
Le modèle a été mis à disposition sur la plateforme cloud des sciences de la Terre AI Earth. Dans certains scénarios spécifiques, par rapport aux modèles de télédétection traditionnels, la précision de l'extraction d'instances peut être améliorée de 25% et la précision de la détection des changements peut être améliorée de 30%.
Adresse du modèle :
https://engine-aiearth.aliyun.com/#/app/aie-seg
Le laboratoire d'IA de Shanghai ouvre la source du premier modèle 3D réel NeRF à l'échelle de la ville

À l'heure actuelle, le laboratoire d'IA de Shanghai a officiellement ouvert le code source du premier modèle 3D grandeur nature NeRF au niveau de la ville au monde, « Shusheng·Skyline » (LandMark), qui prend en charge le déploiement dans différents scénarios d'application et offre une utilisation commerciale gratuite. C'est également la première fois que le Shanghai AI Laboratory publie publiquement l'algorithme de base du modèle multi-branches GridNeRF et la stratégie de formation correspondante.
Site officiel de Scholar · Sky :
https://landmark.intern-ai.org.cn
Adresse open source :
https://github.com/InternLandMark/LandMark
Adresse du document :
https://city-super.github.io/gridnerf
L'Institut de recherche sur l'IA publie Uni3D, un modèle universel de vision 3D à 1 milliard de paramètres

Récemment, l'Académie d'intelligence artificielle a publié le modèle universel de vision 3D open source Uni3D à 1 milliard de paramètres, qui a dépassé les attentes dans les tâches de classification essentielles à la mesure des capacités visuelles générales, ainsi que dans les tâches de reconnaissance, de compréhension et de segmentation à échantillon zéro. Il est rapporté que l'équipe Zhiyuan Vision qui a produit Uni3D avait précédemment publié le modèle visuel universel EVA d'un milliard de dollars. La clé de cette avancée dans le modèle de vision 3D est l’utilisation de la technologie ViT pour mettre à niveau l’expérience de base de pré-formation 2D vers la 3D.
Lien vers l'article :
https://arxiv.org/abs/2310.06773
Liens vers le code/modèle :
https://github.com/baaivision/Uni3D
https://huggingface.co/BAAI/Uni3D/tree/main/modelzoo
Événements récents
Conférence sur l'industrie des sciences des données biomédicales et le développement professionnel de l'Université pharmaceutique de Chine

Du 8 au 9 décembre 2023, la Conférence 2023 sur le développement de l'industrie et de la discipline des sciences des données biomédicales BDSC (The Biomedical Data Science Convention For Industry & Discipline Development) de l'Université pharmaceutique de Chine se tiendra à Nanjing.
Sous le thème « À la recherche de la vérité avec les données et la médecine intelligente », la conférence s'est concentrée sur le développement croisé multidisciplinaire de la biomédecine et de la science des données, a analysé en profondeur les tendances de développement de l'industrie et a exploré la dynamique de pointe, les réalisations académiques et les pratiques d'application de la science des données représentées par l'intelligence artificielle dans de nombreux domaines qui préoccupent l'industrie, tels que la découverte de médicaments, la production de médicaments, la qualité et la sécurité, la supervision des politiques et la transformation numérique et la mise à niveau des entreprises de biomédecine.
Adresse d'inscription :
https://www.huodongxing.com/event/2729440479800
« Après le futur » Deuxième sommet international de l'AI4S

Le 14 décembre 2023, le deuxième sommet international du Forum AI4S « Après le futur » initié par l'École doctorale de l'Université de Pékin à Shenzhen s'ouvrira officiellement au Centre de conférence de l'École doctorale de l'Université de Pékin à Shenzhen.
L'événement a invité le professeur David Baker, membre de l'Académie nationale des sciences des États-Unis, le Dr Liu Tieyan, scientifique en chef distingué de Microsoft, Luo Yi, professeur titulaire de l'Université des sciences et technologies de Chine, You Fengqi, professeur titulaire du département de génie chimique et de génie biomoléculaire de l'Université Cornell, et Cheng Jun, professeur de l'École de chimie et de génie chimique de l'Université de Xiamen, à donner des discours approfondis sur le développement de l'IA pour la science.
Adresse d'inscription :