【ScienceAI Weekly】Les Dernières Recherches De DeepMind Sont À Nouveau Publiées Dans Nature ; Le Premier Modèle De Système Terrestre Développé Par Mon Pays Est Open Source ; Google Lance Un Modèle De Soins De Santé

L'IA pour la science Jetez un œil aux nouvelles réalisations, aux nouveaux développements et aux nouvelles perspectives.
* La dernière recherche de DeepMind, FunSearch, publiée dans Nature
* Google lance MedLM, un modèle pour le secteur de la santé
* Jingtai Technology s'impose à la Bourse de Hong Kong, l'IA et les robots renforcent l'IA pour la science
* GHDDI conclut une coopération avec le Centre de recherche Microsoft pour l'intelligence scientifique
* Outils d'IA pour le traitement et l'analyse sismologiques open source
* le premier modèle de système terrestre développé indépendamment par mon pays est annoncé comme étant open source
* L'équipe Baidu PaddlePaddle construit HelixDock, un modèle de prédiction de conformation d'amarrage protéine-petite molécule
* Une équipe de recherche nationale publie une méthode et un système de prévision des émissions de carbone basés sur l'apprentissage automatique hybride
* Cadre d'apprentissage automatique open source « version personnalisée exclusive » de la puce Apple
Plus de détails ci-dessous~
Actualités de l'entreprise
DeepMind Dernières recherches FunSearch publiées dans Nature
La dernière recherche de Google DeepMind, FunSearch, est une méthode de recherche de nouvelles solutions en mathématiques et en informatique. FunSearch fonctionne en associant un grand modèle pré-entraîné (LLM) à un « évaluateur » automatique, chargé de prévenir les hallucinations et les idées erronées. En itérant dans les deux sens entre ces deux composants, la solution initiale « évolue » vers de nouvelles connaissances. FunSearch a découvert de nouvelles solutions au problème de l'ensemble plafonné, un problème ouvert de longue date en mathématiques qui représente la première découverte de problèmes ouverts difficiles en sciences ou en mathématiques utilisant de grands modèles.Adresse du document :nature.com/articles/s41586-023-06924-6
Google lance MedLM, un modèle pour le secteur de la santé
Récemment, Google a annoncé le lancement d'un nouvel ensemble de modèles d'intelligence artificielle spécifiques aux soins de santé, MedLM, conçus pour aider les cliniciens et les chercheurs à mener des recherches complexes, à résumer les interactions médecin-patient, etc. Cette initiative marque la dernière tentative de Google de monétiser ses outils d'IA dans le secteur de la santé et constitue une étape importante dans la transformation numérique du secteur de la santé. Premièrement, MedLM peut aider les cliniciens et les chercheurs à mener des recherches et des analyses de données complexes pour améliorer la précision et l’efficacité du diagnostic médical. Deuxièmement, MedLM peut résumer les interactions médecin-patient et offrir aux médecins une meilleure expérience de gestion et de service des patients. En outre, MedLM peut également fournir aux établissements de santé de meilleurs outils de gestion et d’analyse des données pour améliorer l’efficacité de l’utilisation des ressources médicales.
Jingtai Technology se dirige vers la Bourse de Hong Kong, l'IA et les robots renforcent l'IA pour la science
QuantumPharm Inc. (QuantumPharm) a officiellement soumis son prospectus à la Bourse de Hong Kong le mois dernier, avec l'intention de s'inscrire sur le marché principal en vertu de la règle 18C. Les règles 18C s'adressent principalement aux entreprises de technologie spécialisée et ont des exigences élevées en matière d'attributs technologiques de l'industrie, couvrant des industries telles que les technologies de l'information de nouvelle génération, le matériel et les logiciels avancés, les matériaux avancés, les nouvelles énergies et la conservation de l'énergie et la protection de l'environnement, les nouvelles technologies alimentaires et agricoles, etc. Jingtai Technology est l'une des rares sociétés de R&D en sciences pharmaceutiques et des matériaux au monde à disposer d'un calcul de premier ordre basé sur la physique quantique, d'une technologie d'intelligence artificielle avancée et de capacités de laboratoire humide automatisées. C'est également l'une des rares plateformes de R&D en sciences des médicaments et des matériaux au monde axées sur la physique quantique + l'IA + l'automatisation.
GHDDI et le Centre de recherche Microsoft pour l'intelligence scientifique collaborent
Récemment, le Global Health Drug Discovery Institute (GHDDI) et Microsoft Research AI4Science ont annoncé une collaboration pour développer conjointement l'intelligence artificielle générative et les technologies de base de modèles à grande échelle dans le domaine des maladies infectieuses de santé mondiale, en se concentrant sur la transformation sur site et en accélérant le développement de médicaments innovants. Auparavant, les deux parties ont conçu avec succès une variété d'inhibiteurs de petites molécules avec de nouvelles structures dans la recherche sur Mycobacterium tuberculosis et les protéines cibles clés du coronavirus.
BioGeometry et Zhipu AI construisent conjointement un langage naturel-langage de la vieGrand modèle multimodal
Beijing Biogeometry Biotechnology Co., Ltd. et Beijing Zhipu Huazhang Technology Co., Ltd. ont récemment annoncé un partenariat stratégique et s'engagent conjointement à construire un grand modèle multimodal de langage naturel-langage de vie. Ce modèle devrait améliorer l’utilité des plateformes d’IA générative dans les sciences de la vie et la recherche médicale.
Outils et ressources
L'outil d'IA pour le traitement et l'analyse sismologiques est open source
Outils open source pour le traitement et l'analyse sismologiques, incluant actuellement : la sélection de phase, la polarisation et l'extraction de dispersion. L'outil a rendu open source le modèle 100 Hz pour la Chine. Certains modèles sont formés sur la base de l’ensemble de données CSNCD. Les modèles de sélection des quatre phases sismiques PgSgPnSn ont la plus grande précision.accéderadresse:https://gitee.com/cangyeone/seismological-ai-tools
le premier modèle du système terrestre développé indépendamment par mon pays est annoncé comme étant open source
Récemment, l'Institut de physique atmosphérique de l'Académie chinoise des sciences a publié le premier modèle numérique « complet » du système terrestre de mon pays, doté de droits de propriété intellectuelle indépendants, et a annoncé la publication de son code source. Ce modèle comprend un système climatique complet et un système environnemental écologique, intégrant huit modèles de sous-systèmes tels que la circulation atmosphérique et la circulation océanique. C'est également une infrastructure scientifique et technologique nationale majeure.Installation de simulation numérique du système terrestre« Le logiciel principal du programme, totalisant environ 2,7 millions de lignes de code, s'appelle « Earth Laboratory ».
L'équipe Baidu Propeller construit HelixDock, un modèle de prédiction de conformation d'amarrage protéine-petite molécule
L'équipe Baidu PaddlePaddle a construit le modèle de prédiction de conformation d'amarrage protéine-petite molécule HelixDock en construisant un ensemble de données de simulation à grande échelle et en mettant à niveau les réseaux neuronaux basés sur la géométrie, ce qui a considérablement amélioré la précision de la prédiction de conformation.Pour plus de résultats, consultez l'article HelixDock :https://arxiv.org/abs/2310.13913
Adresse d'accès à l'hélice :https://paddlehelix.baidu.com/
Une équipe de recherche nationale publie une méthode et un système de prévision des émissions de carbone basés sur l'apprentissage automatique hybride
Une équipe de recherche nationale a dévoilé une méthode et un système de prédiction des émissions de carbone basés sur l’apprentissage automatique hybride. La méthode traite l’ensemble de données via un modèle de combinaison cible pour obtenir les résultats de prédiction des émissions de carbone. Parmi eux, le modèle de combinaison cible réalise la combinaison pondérée optimale de la prédiction de séries chronologiques univariées et du modèle de facteur moteur multivarié grâce aux pondérations de calcul cible, en tenant compte des avantages de chaque modèle et en améliorant la précision de la prédiction des émissions de carbone.Visitez l'URL :https://cprs.patentstar.com.cn/Search/Detail?ANE=9HFF9IBA9GDC5BCA8GBA9FHE9AHA8BCA9DFB9CFF9GFF7BDA
Le framework d'apprentissage automatique sur mesure d'Apple est désormais open source
MLX est une puce conçue spécifiquement pour AppleCadre d'apprentissage automatique (cliquez ici pour une explication détaillée), vise à soutenir une formation et un déploiement efficaces des modèles sur les puces Apple tout en garantissant la convivialité. Son concept de conception est simple, faisant référence à des frameworks tels que NumPy, PyTorch, Jax et ArrayFire, y compris des fonctions clés telles que le calcul paresseux et la construction de graphiques dynamiques.Visitez l'URL :https://github.com/ml-explore/mlx/tree/main/examples
Résultats de la rechercheDANTE : Vers un calcul intelligent optoélectronique à grande échelle
Entraînement de réseaux neuronaux optoélectroniques à grande échelle avec apprentissage optique-artificiel à double neurone

* source:Nature Communications
* champRéseau neuronal, intelligence optoélectronique
* auteurGroupe de recherche de Fang Lu, Département de génie électronique, Université Tsinghua
L'équipe de recherche a proposé une architecture d'apprentissage à double neurone optique-artificiel (DuAl-Neuron opTical-artificial lEarning, DANTE) pour le calcul intelligent optoélectronique à grande échelle. Les neurones optiques modélisent avec précision le processus de calcul du champ lumineux, les neurones artificiels utilisent des fonctions de mappage légères pour établir des connexions de saut afin de faciliter la propagation du gradient, et les neurones artificiels globaux et les neurones optiques locaux sont optimisés de manière itérative à l'aide d'un mécanisme d'apprentissage alternatif. Tout en garantissant l’efficacité de l’apprentissage, il réduit considérablement la complexité spatio-temporelle de la formation, permettant de former des réseaux neuronaux optoélectroniques plus grands et plus profonds.
Lire l'article original :https://www.nature.com/articles/s41467-023-42984-y
Cadre de réseau neuronal convolutif PtyNet : Traitement massif de données par rayonnement synchrotron
Une stratégie efficace de reconstruction ptychographique grâce au réglage fin d'un grand modèle d'apprentissage profond pré-entraîné

* source:iScience
* champ:Exploration de données, réseaux de neurones convolutifs
* auteurÉquipe de l'Académie chinoise des sciences
L'équipe de recherche a développé un cadre de réseau neuronal convolutif appelé PtyNet pour récupérer la projection précise des objets à partir des données expérimentales de ptychographie aux rayons X. Grâce au support d'un puissant cluster de calcul, PtyNet peut acquérir rapidement des données provenant de sources de rayonnement synchrotron pour la formation et reconstruire rapidement des images des données expérimentales des utilisateurs.
Lire l'article original :https://doi.org/10.1016/j.isci.2023.108420
Prédire plusieurs conformations grâce au clustering de séquences et à AlphaFold2
Prédire plusieurs conformations via le clustering de séquences et AlphaFold2

* source:Nature
* champBioinformatique
* auteur:Équipe de recherche de l'Université Brandeis et du Howard Hughes Medical Institute, de l'Université Harvard et de l'Université de Cambridge
L'équipe de rechercheSimilarité de séquenceLe regroupement d'alignements de séquences multiples (MSA) permet à AF2 d'échantillonner des états alternatifs de protéines métamorphiques connues avec une grande confiance. Dans le même temps, les chercheurs ont utilisé la méthode AF-Cluster pour étudier la distribution évolutive de la structure prédite de la protéine déformée KaiB5 et ont constaté que les prédictions des deux conformations étaient distribuées dans les clusters de la famille KaiB.
Lire l'article original :
https://www.nature.com/articles/s41586-023-06832-9
ProRefiner : un modèle de conception de repliement inverse des protéines
ProRefiner : une stratégie de raffinage basée sur l'entropie pour le repliement inverse des protéines avec attention graphique globale

* source:Nature Communications
* champ:Gènes biologiques, apprentissage profond
* auteur:Équipe de recherche de l'Université chinoise de Hong Kong, du laboratoire Zhijiang, du laboratoire Huawei Noah's Ark et de l'Université médicale de Nanjing
L'équipe de recherche a présenté ProRefiner, un modèle d'attention graphique global efficace en termes de mémoire qui peut exploiter pleinement le contexte de débruitage, et a démontré l'applicabilité de ProRefiner dans la refonte de la transposase B associée au transposon (TnpB), avec 6 des 20 variantes proposées montrant une activité d'édition génétique améliorée.
Lire l'article original :https://www.nature.com/articles/s41467-023-43166-6
KPGT : un cadre d'apprentissage auto-supervisé
Un cadre de pré-formation guidé par les connaissances pour améliorer l'apprentissage de la représentation moléculaire

* source:Nature Communications
* champ: Biomolécules, Découverte de médicaments
* auteurÉquipe de recherche de l'Université Tsinghua, de l'Université Westlake et du Laboratoire Zhijiang
L'équipe de recherche a proposé le Knowledge-guided Pre-training of Graph Transformer (KPGT), un cadre d'apprentissage auto-supervisé qui fournit des prédictions de propriétés moléculaires améliorées, généralisables et robustes grâce à un apprentissage de la représentation moléculaire considérablement amélioré. Le cadre KPGT intègre un transformateur de graphes conçu pour les graphes moléculaires et une stratégie de pré-formation guidée par les connaissances pour capturer pleinement les connaissances structurelles et sémantiques des molécules.Lire l'article original :https://www.nature.com/articles/s41467-023-43214-1
Revue de l'événement
La conférence CoRL se termine et les meilleurs articles et le meilleur article sur le système sont annoncés.
La conférence 2023 sur l'apprentissage des robots (CoRL) s'est tenue à Atlanta, aux États-Unis, le mois dernier. Selon les données officielles, 199 articles provenant de 25 pays ont été sélectionnés pour CoRL cette année, avec des sujets populaires tels que la manipulation, l'apprentissage par renforcement, etc.
Le prix du meilleur article a été décerné à « Distilled Feature Fields Enable Few-Shot Language-Guided Manipulation »
* auteur:William Shen, Ge Yang, Alan Yu, Jensen Wong, Leslie Pack Kaelbling, Phillip Isola
* mécanisme:AVEC CSAIL, IAIFI
Lire l'article original :https://openreview.net/forum?id=Rb0nGIt_kh5
Pour d'autres récompenses, veuillez visiter le site officiel :https://www.corl2023.org/awards
Thèmes de l'atelier IA4Science NASSMA 2022
Le séminaire a été organisé conjointement par NASSMA, l'Université Mohammed VI Polytechnique et Google Deepmind. Actuellement, la présentation du séminaire PPT et la rediffusion en direct sont en ligne.
Ce qui précède est tout le contenu à partager dans ce numéro de « Science AI Weekly » ~
Si vous disposez des derniers résultats de recherche, d'informations de première main sur les entreprises, etc. concernant l'IA pour la science, veuillez laisser un message pour « exposer l'information ».