【ScienceAI Weekly】La Société Pharmaceutique D'ia Scindée De DeepMind Parvient À Un Nouvel Accord De 3 Milliards De Dollars ; ByteDance Recruterait Des Talents En Biologie/chimie/physique Aux États-Unis

Nouvelles réalisations, nouveaux développements et nouvelles perspectives de l’IA pour la science——* Une société pharmaceutique d'IA issue de DeepMind conclut sa première coopération pharmaceutique d'une valeur de 3 milliards de dollars* Microsoft aide les chercheurs à découvrir 32 millions de nouveaux matériaux de batterie* TikTok recruterait des talents en biologie computationnelle, chimie quantique, dynamique moléculaire et physique à travers les États-Unis* iFlytek prévoit de scinder son activité médicale et de la coter au tableau principal de la Bourse de Hong Kong* Magnesium Chemical réalise un financement de série A de 26 millions de dollars* La revue académique Science utilise des outils d'IA pour détecter les fausses images dans les revues
Voir ci-dessous pour plus de détails~
Actualités de l'entreprise
Une société pharmaceutique d'IA issue de DeepMind conclut son premier partenariat pharmaceutique
Le 8 janvier, Isomorphic Labs, une société pharmaceutique d'IA dépendant d'Alphabet, a annoncé avoir conclu deux accords de recherche et développement de médicaments d'une valeur de 3 milliards de dollars américains avec Eli Lilly et Novartis. La collaboration implique le développement de traitements pour de multiples protéines et voies liées à des maladies. Isomorphic Labs a été fondée en novembre 2021 et est issue de DeepMind de Google, se concentrant sur le domaine de la médecine de l'IA. La société a utilisé les réalisations de DeepMind en matière de recherche biomédicale, notamment son modèle de prédiction de la structure des protéines AlphaFold, pour mener à bien le développement de médicaments.
Microsoft aide les chercheurs à découvrir 32 millions de nouveaux matériaux de batterie
Il est rapporté que le Pacific Northwest National Laboratory a utilisé le service Azure Quantum Elements de Microsoft pour évaluer rapidement 32 millions de nouveaux matériaux de batterie potentiels ; le Département de l’Énergie des États-Unis a découvert 18 matériaux candidats prometteurs après 80 heures d’utilisation du service, ce qui aurait pu prendre des décennies avec les méthodes de recherche traditionnelles ; Le fabricant britannique de produits chimiques Johnson Matthey utilise ce service pour accélérer la recherche et le développement de piles à combustible à hydrogène.
TikTok recruterait des talents en biologie computationnelle, en chimie quantique, en dynamique moléculaire et en physique à travers les États-Unis.
Il a été rapporté que la société mère de TikTok, ByteDance, recrute des talents en biologie computationnelle, en chimie quantique, en dynamique moléculaire et en physique pour ses équipes de conception de médicaments IA et de science IA. Il est rapporté que ByteDance recrute au moins 17 postes connexes à New York, en Californie et dans l'État de Washington.
iFlytek prévoit de scinder son activité médicale et de la coter au marché principal de la Bourse de Hong Kong
Le soir du 9 janvier, iFLYTEK a annoncé que la société prévoyait de scinder sa filiale de contrôle iFLYTEK Medical et de la coter au tableau principal de la Bourse de Hong Kong. La taille de l'offre actuelle d'iFlytek Medical ne dépassera pas 15% du capital social total après l'émission. Une fois la scission réalisée, iFLYTEK conservera toujours le contrôle d'iFLYTEK Medical.
Fondée en mai 2016, iFlytek Medical a construit un système de solution médicale d'intelligence artificielle basé sur des technologies de base de pointe telles que l'informatique sémantique médicale, la compréhension de texte, le raisonnement cognitif et l'exploration de données. Il cible les besoins généraux des praticiens du secteur médical tels que les établissements médicaux primaires, les hôpitaux, les patients et les résidents, et couvre l'ensemble du processus médical, depuis l'alerte aux maladies, le dépistage précoce, le diagnostic, le traitement et l'évaluation de l'efficacité, jusqu'au post-diagnostic et à la gestion des maladies chroniques.
Magnesium Chemical finalise un financement de série A de 26 millions de dollars américains
Shanghai Meirui Technology Co., Ltd. a récemment finalisé un tour de financement de série A de 26 millions de dollars américains, mené conjointement par Qiming Venture Partners et LYFE Capital, et suivi par Sinovation Ventures et Mega Technology. Les fonds de financement serviront à améliorer davantage la recherche et le développement de produits, à élargir les marchés commerciaux et à soutenir l’implantation internationale.
Magnesium Chemical a été fondée en janvier 2022 et a été incubée par Mega et a réalisé un tour d'investissement providentiel. L'entreprise a été fondée par une équipe ayant une expérience interdisciplinaire internationale. Elle s'engage à utiliser des plates-formes automatisées et intelligentes pour fournir une nouvelle génération de services CRO de synthèse chimique aux nouveaux clients de recherche et développement de médicaments, raccourcissant considérablement le cycle de livraison de la synthèse chimique dans le cycle de recherche et développement de nouveaux médicaments et réduisant considérablement les coûts liés à la synthèse chimique, éliminant ainsi la situation actuelle où la synthèse chimique des médicaments dépend fortement des opérations manuelles.
La revue scientifique Science utilise des outils d'IA pour détecter les fausses images dans les revues
Science a déployé la plateforme Proofig et mène des essais depuis plusieurs mois, avec des preuves claires que des données problématiques, telles que des images manipulées pour tromper les lecteurs, peuvent être détectées avant la publication d'un article. De plus, Science utilise également cet outil de détection avec un logiciel de détection de plagiat de texte pour remplacer la révision manuelle.
Outils et ressources
Huawei et l'Université de Hong Kong ouvrent le modèle mathématique géométrique G-LLaVA
Actuellement, les grands modèles de langage multimodaux ne sont toujours pas en mesure d’analyser avec précision les éléments de base et leurs relations dans les figures géométriques. Pour résoudre ce problème, le laboratoire Huawei Noah's Ark, l'Université de Hong Kong et l'Université des sciences et technologies de Hong Kong ont conjointement ouvert le modèle professionnel de mathématiques géométriques G-LLaVA. Pour tester les performances de G-LLaVA, les chercheurs ont mené une évaluation approfondie avec d’autres grands modèles sur la célèbre plateforme de tests mathématiques MathVista. Les résultats montrent que les performances du G-LLaVA dépassent celles des modèles tels que GPT-4-V, LLaVA1.5 et MiniGPT-4.
Adresse open source :
https://github.com/pipilurj/G-LLaVA
Adresse du document :
https://arxiv.org/abs/2312.11370
Groupe de modèles médicaux open source « Puyi 2.0 » du laboratoire d'IA de Shanghai
Récemment, le laboratoire d'IA de Shanghai et des partenaires tels que l'hôpital Ruijin affilié à la faculté de médecine de l'université Jiao Tong de Shanghai ont publié conjointement le groupe de modèles de base multimodaux médicaux « OpenMEDLab2.0 », réalisant ainsi l'open source unique de « production, apprentissage, recherche, application et évaluation » du grand groupe de modèles médicaux, visant à fournir un support de capacité pour les applications médicales d'IA « inter-domaines, inter-maladies et inter-modalités ».
Adresse open source :
github.com/OpenMEDLab
Le premier ensemble de données de raisonnement spécialisé dans la médecine en Chine, RJUA-QA, est désormais open source
Ant Group et l'équipe d'experts en urologie de l'hôpital Renji de Shanghai ont développé et lancé conjointement le premier ensemble de données de raisonnement par questions-réponses de spécialité médicale chinoise RJUA-QA en construisant des données de cas simulés basées sur l'expérience clinique de l'équipe médicale. L'ensemble de données se compose de trois parties : formation, validation et test, et contient 2 132 paires questions-réponses d'assurance qualité. Le contexte provient des Lignes directrices chinoises pour le diagnostic et le traitement des maladies urologiques et andrologiques. Les types de maladies couvrent plus de 97,6% de la population médicale urologique et peuvent véritablement reproduire les scénarios de diagnostic et de traitement.
Adresse du jeu de données :
http://openkg.cn/dataset/rjua-qadatasets
paperai : moteur de découverte et d'analyse de littérature médicale/scientifique
paperai est un moteur de découverte et d'examen de la littérature alimenté par l'IA pour les articles médicaux/scientifiques. L'outil exécute une requête pour filtrer les articles qui répondent à des critères spécifiques et exécute une fonction de rapport basée sur une technologie d'extraction de questions-réponses pour trouver des réponses aux questions clés à partir d'un ensemble d'articles médicaux/scientifiques. paperai a été utilisé pour analyser l'ensemble de données de recherche ouvert COVID-19 (CORD-19) et a remporté plusieurs prix dans le cadre du CORD-19 Kaggle Challenge.
Adresse de l'outil :
https://paperpal.com/paperpal-for-researchers
DeepKE : l'outil open source d'extraction de graphes de connaissances chinois de l'Université du Zhejiang basé sur l'apprentissage profond
DeepKE est un outil d'extraction de graphes de connaissances open source et évolutif qui prend en charge les scénarios de supervision complète conventionnels, de faibles ressources, de quelques échantillons et de niveau document, couvrant diverses tâches d'extraction d'informations, notamment la reconnaissance d'entités nommées, l'extraction de relations et l'extraction d'attributs. Grâce à un cadre unifié, DeepKE permet aux développeurs et aux chercheurs de personnaliser les ensembles de données et les modèles et d'extraire des informations à partir de textes non structurés en fonction de leurs besoins.
Adresse de l'outil :
http://openkg.cn/tool/deepke
ResGen : Un modèle de génération moléculaire 3D basé sur la perception des poches de protéines
Une équipe de recherche de l'Université du Zhejiang et du Laboratoire Zhijiang a proposé un modèle de génération moléculaire 3D basé sur des poches de protéines - ResGen, qui est utilisé pour concevoir des molécules organiques dans une cible donnée. ResGen est plus efficace en termes de calcul, environ huit fois plus rapide que la meilleure technologie actuelle, et présente un taux de réussite plus élevé dans la génération de nouvelles molécules que les meilleures méthodes actuelles.
Adresse open source :
https://github.com/HaotianZhangAI4Science/ResGen
Résultats de la recherche
L'IA générative génère de nouvelles réactions chimiques en 6 secondes
Génération précise d'états de transition avec un modèle de diffusion de réaction élémentaire équivariant sensible aux objets

* Source : Nature Computational Science
* Domaine : Sciences chimiques, apprentissage automatique
* Auteur : équipe du MIT
Des chercheurs ont développé une méthode alternative basée sur l’apprentissage automatique qui permet de découvrir les états de transition des réactions chimiques en quelques secondes. Le nouveau modèle peut aider les chimistes à explorer et à concevoir de nouvelles réactions et de nouveaux catalyseurs capables de générer des produits utiles à haute valeur ajoutée, tels que des composés combustibles ou des médicaments. De plus, le modèle est capable de simuler des réactions chimiques naturelles.
Lire l'article original :
https://www.nature.com/articles/s43588-023-00563-7
Modèle de classification rapide des batteries hors service basé sur l'apprentissage fédéré
Tri collaboratif et respectueux de la vie privée des batteries usagées pour un recyclage direct rentable via l'apprentissage automatique fédéré

* Source : Nature Communications
* Domaine : Sciences de la communication, apprentissage automatique
* Auteur : Zhang Xuan et Zhou Guangmin de l'École supérieure internationale de Shenzhen de l'Université Tsinghua
L'équipe de recherche a établi un modèle de classification rapide pour les batteries hors service basé sur l'apprentissage fédéré, qui peut réaliser une classification précise des matériaux d'électrode positive des batteries hors service avec seulement une petite quantité d'informations de test sur le terrain sans avoir besoin de données d'exploitation historiques.
Lire l'article original :
https://doi.org/10.1038/s41467-023-43883-y
UniKP : un cadre unifié pour prédire les paramètres cinétiques enzymatiques
UniKP : un cadre unifié pour la prédiction des paramètres cinétiques enzymatiques

* Source : Nature Communications
* Domaine : Biotechnologie, Modélisation du langage
* Auteur : Équipe de l'Académie chinoise des sciences
Les chercheurs ont développé un cadre de prédiction des paramètres cinétiques enzymatiques (UniKP) basé sur un modèle de langage volumineux pré-entraîné et un modèle d'apprentissage automatique. Ce cadre peut prédire une variété de paramètres cinétiques enzymatiques différents en utilisant uniquement la séquence d'acides aminés d'une enzyme donnée et les informations structurelles de son substrat.
Lire l'article original :
https://www.nature.com/articles/s41467-023-44113-1
DeepProSite : Identification des sites de liaison des protéines
DeepProSite : prédiction du site de liaison des protéines en fonction de la structure à l'aide d'ESMFold et d'un modèle de langage pré-entraîné

* Source : Bioinformatique
* Domaine : Biomédecine, Modèle de langage
* Auteur : Équipe de l'Université Jiao Tong de Shanghai et de l'Université Sun Yat-sen
DeepProSite utilise les informations sur la structure et la séquence des protéines pour identifier les sites de liaison des protéines. Il génère des structures protéiques à partir d'ESMFold et des représentations de séquences à partir d'un modèle de langage pré-entraîné, et utilise Graph Transformer pour formuler des prédictions de sites de liaison sous forme de classifications de nœuds graphiques.
Lire l'article original :
https://academic.oup.com/bioinformatics/article/39/12/btad718/7453375
Événements à venir
Formation ALCF : Les bases du supercalculateur pour promouvoir l'IA dans la recherche

« Introduction à la science pilotée par l'IA sur les superordinateurs » est hébergé par l'Argonne Leadership Computing Facility (ALCF) et est une série d'événements en ligne gratuits qui seront divisés en deux parties : des conférences et des séances pratiques. Les paramètres du cours sont :
* Semaine 1 : Introduction aux supercalculateurs
* Semaine 2 : Introduction aux réseaux neuronaux
* Semaine 3 : Exploration plus approfondie des réseaux neuronaux
* Semaine 4 : Introduction aux grands modèles de langage
* Semaine 5 : Intégration et tokenisation de grands modèles de langage
* Semaine 6 : Méthodes d'entraînement parallèle pour l'IA
Lien d'inscription :
https://www.alcf.anl.gov/alcf-ai-science-training-series?ct=t(EVT-ALCFINTROTOAI_01092024)
Ce qui précède est tout le contenu que « Science AI Weekly » souhaite partager~
Si vous disposez des derniers résultats de recherche, d'informations de première main sur les entreprises, etc. concernant l'IA pour la science, veuillez laisser un message pour « exposer l'information ».