Tutoriel En Ligne | 150 Outils Professionnels/59 Bases De Données/105 Packages, Biomni Surpasse L'efficacité De Niveau Expert Dans 8 Tâches De Recherche Réelles

La recherche biomédicale moderne est prise dans la contradiction entre « explosion des données » et « goulot d'étranglement en termes d'efficacité ». D'une part, le développement de technologies telles que le séquençage génétique et l'analyse unicellulaire a généré des volumes massifs de données multimodales – des séquences de bases génomiques aux données d'imagerie clinique, de l'abondance des microbiomes aux cartes moléculaires des métabolomes ; l'échelle des données a atteint le niveau du PB ; d'autre part, la fragmentation des processus de recherche a sérieusement limité la vitesse de découverte : une analyse multi-omique classique peut nécessiter l'appel de plus de dix outils, l'interrogation de dizaines de bases de données et la consultation de centaines d'articles. Ces tâches sont souvent effectuées manuellement par les chercheurs, ce qui est non seulement chronophage, mais aussi source d'erreurs.
Cependant, la plupart des outils d’IA existants sont « spécialisés », comme les modèles qui se concentrent sur la conception d’expériences CRISPR ou l’annotation de cellules individuelles.Ils ne peuvent gérer qu’une seule tâche et ont des difficultés à collaborer entre domaines.Lorsque la recherche implique l'intersection de la génétique et de la pharmacologie, ou doit intégrer des données cliniques aux résultats de la recherche fondamentale, ces outils ne sont pas à la hauteur. Par conséquent, la création d'un agent biomédical intelligent, capable de penser au-delà des frontières et de prendre des décisions autonomes à l'instar des scientifiques, est devenue la clé pour résoudre le dilemme actuel de la recherche.
À cet égard,L'Université de Stanford, en collaboration avec Genentech, Arc Institute, UCSF et d'autres institutions, a développé le premier agent d'IA biomédicale générale, Biomni.Il peut réaliser de manière autonome un large éventail de tâches de recherche dans différents domaines biomédicaux et créer le premier agent environnemental unifié, exploitant les outils, bases de données et solutions nécessaires à partir de dizaines de milliers de publications dans 25 domaines biomédicaux. Sur cette base, Biomni dispose d'une architecture d'agent généraliste combinant le raisonnement par grands modèles de langage (LLM) avec une planification optimisée par la récupération et une exécution basée sur le code, ce qui lui permet de créer et d'exécuter dynamiquement des flux de travail biomédicaux complexes sans s'appuyer sur des modèles prédéfinis ou des processus de tâches stricts. Les tests de performance du système montrent que Biomni atteint une forte généralisation dans des tâches biomédicales hétérogènes sans aucun réglage spécifique à la tâche.
Adresse du document :
Lien vers le didacticiel de déploiement en un clic :
L’objectif principal de Biomni est de développer un agent d’IA biomédicale général qui ne nécessite pas de modèle prédéfini, afin qu’il puisse effectuer de manière autonome des tâches de recherche interdomaines.Plus précisément, il comprend trois aspects des capacités :
* Dépasser les limites spécifiques aux tâches :Biomni espère pouvoir gérer une variété de tâches allant du « diagnostic de maladies rares » à « l'analyse des différences du microbiome » en utilisant uniquement des instructions en langage naturel.
* Intégration des capacités multimodales :Ouvrir l'ensemble du processus, des données aux expériences. La boucle fermée de la recherche biomédicale est la suivante : « saisie des données → analyse et raisonnement → génération d'hypothèses → conception expérimentale → vérification des résultats ». Biomni doit couvrir chaque étape : il peut traiter les données des appareils portables au format Excel et les données des cellules individuelles au format h5ad, générer du code Python pour l'analyse et concevoir des expériences PCR pour vérifier les hypothèses.
* Établir un nouveau paradigme de collaboration homme-machine :Le positionnement de Biomni n'est pas de remplacer les scientifiques, mais de devenir un « super assistant » - effectuant automatiquement des tâches répétitives telles que le nettoyage des données et la recherche de littérature, permettant aux chercheurs de se concentrer sur la construction d'hypothèses et la conception innovante.
Ensemble de données : Ensemble de données à trois couches pour créer une base de connaissances biomédicales
Les puissantes capacités de Biomni proviennent de son intégration systématique des ressources de recherche biomédicale. En construisant un ensemble de données à trois niveaux, l'équipe a créé un « laboratoire numérique » pour l'IA, couvrant les outils, les données et les tâches.
Définir les unités opérationnelles de base de la recherche biomédicale,L'équipe a sélectionné 100 articles les plus récents publiés en 2024 dans chacune des 25 catégories de sujets de bioRxiv (telles que la génomique, la microbiologie et la pharmacologie).Grâce à l'« Agent de découverte d'actions », le processus de recherche est analysé un par un et quatre éléments clés sont extraits : tâches, outils, logiciels et bases de données. La base de données contient 59 ressources clés, divisées en deux catégories : les grandes bases de données accessibles par API (comme PDB pour le stockage des structures protéiques et ClinVar, une base de données de variations cliniques), et les ensembles de données structurées déployés localement (comme les statistiques récapitulatives GWAS et les génomes de référence du microbiome).
Deuxièmement, pour vérifier la capacité de généralisation, l’équipe a construit un ensemble de données d’évaluation à plusieurs niveaux : un référentiel de connaissances générales et un ensemble de tâches du monde réel.Les critères de référence en matière de connaissances générales incluent LAB-Bench (y compris les réponses aux questions de la base de données DbQA et le raisonnement séquentiel SeqQA) et Humanity's Last Exam (couvrant 14 sous-domaines biomédicaux).Ces ensembles de données ne s'appuient pas sur des outils spécifiques et se concentrent sur l'examen des capacités de raisonnement fondamentales de l'IA. L'ensemble de tâches concrètes comprend huit tâches transversales, chacune correspondant à un scénario de recherche réel.
Pour démontrer la valeur de l’application pratique,L'équipe a sélectionné trois types de données typiques comme données d'étude de cas :
* Données des appareils portables : 458 fichiers Excel de 30 participants, y compris des données de surveillance continue du glucose (CGM) et de température (couvrant 2 heures avant les repas à 4 heures après les repas) et 227 nuits d'enregistrements de sommeil (y compris la durée du sommeil, l'efficacité, le stade, etc.) ;
* Données multi-omiques : ensemble de données unicellulaires du développement du squelette embryonnaire humain (données snRNA-seq et snATAC-seq de 336 000 noyaux), ainsi que données multi-omiques de 652 lipides, 731 métabolites et 1 470 protéines ;
* Données d'expériences humides : 10 tâches de clonage (couvrant Golden Gate, Gibson et d'autres méthodes), ainsi que des expériences de construction de vecteurs CRISPR ciblant le gène B2M, utilisées pour vérifier le plan expérimental conçu par Biomni.
Architecture du modèle : conception à double moteur et mécanisme de collaboration intelligent
Biomni se compose de deux composants principaux : Biomni-E1, un environnement biomédical de base avec un espace d'action unifié, et Biomni-A1, un agent conçu pour utiliser efficacement cet environnement.
* Biomni-E1 n'est pas une simple collection d'outils, mais un « laboratoire numérique » structuré dont la conception doit respecter les trois principes d'authenticité, de flexibilité et d'évolutivité. Autrement dit, tous les outils, logiciels et bases de données doivent être vérifiés par des experts ; le logiciel est déployé de manière conteneurisée, prend en charge le changement de version et les requêtes de base de données prennent en charge la saisie en langage naturel ; des interfaces réservées permettent l'ajout de nouveaux outils.
* Biomni-A1 est le « centre de décision » de l'intelligence générale. Son architecture rompt avec le modèle « entrée-sortie » de l'IA traditionnelle. Son processus de résolution de problèmes est similaire à celui des scientifiques et il effectue une sélection dynamique d'outils basée sur une planification optimisée par la récupération. Il utilise le code comme interface universelle et prend en charge une logique complexe comme les boucles, le parallélisme et les jugements conditionnels. Il prend en charge la planification adaptative : le plan initial est généré à partir des connaissances acquises et peut être ajusté en fonction des retours d'expérience pendant l'exécution.

Conclusion expérimentale : Excellentes performances, des tests de référence à la vérification en laboratoire humide
Les performances de Biomni ont été vérifiées par des expériences à plusieurs niveaux, et ses résultats ont non seulement démontré des avancées technologiques, mais ont également révélé la valeur pratique de l’IA biomédicale générale.
Lors de tests de référence standardisés, Biomni a démontré des avantages significatifs :
* Dans le test LAB-Bench,La précision des réponses aux questions de la base de données (DbQA) a atteint 74,4%, ce qui est comparable aux experts humains (74,7%) et dépasse de loin l'agent de codage (40,8%) ; la précision du raisonnement séquentiel (SeqQA) a atteint 81,9%, dépassant le niveau humain (78,8%), indiquant que sa capacité à traiter des données structurées et des séquences biologiques est proche de celle des chercheurs professionnels.
* Dans le test HLE,52 questions couvrant 14 domaines ont été évaluées, avec une précision de 17,3%, soit 2,9 fois celle du LLM de base (6,0%) et 1,3 fois celle de l'agent d'encodage (12,8%). Il est à noter que HLE ne nécessite aucun réglage de l'ensemble de développement et teste pleinement la capacité de généralisation à échantillon zéro. Les résultats montrent que Biomni peut traiter des problèmes inter-domaines non identifiés.
De plus, dans 8 tâches du monde réel,Français La performance moyenne de Biomni dépasse largement la ligne de base : 402,3% supérieure à la LLM de base, 43,0% supérieure à l'agent codant et 20,4% supérieure à la variante qui utilise uniquement le raisonnement en chaîne ReAct (Biomni-ReAct). Dans la tâche de segmentation, la précision de la détection du gène causal GWAS a atteint 68,3% (la moyenne des experts humains est de 71,2%), le taux de correspondance sémantique des annotations unicellulaires était de 89,7% et le score d'alignement clinique du repositionnement du médicament était de 0,78 (score total de 1,0).

En bref, Biomni s'affranchit des limites de l'IA traditionnelle dans le domaine biomédical, qui impose de confier des tâches spécifiques à des personnes spécifiques, et met en œuvre un processus complet de fonctionnement autonome, de l'analyse des réseaux de régulation génétique à la conception d'expériences en milieu humide. Il s'agit non seulement d'une innovation technique, mais aussi d'une vision d'un avenir où les biologistes virtuels en IA travailleront aux côtés des scientifiques et amélioreront leurs capacités.
à l'heure actuelle,« Biomni : le premier agent intelligent biomédical universel » a été lancé dans la section « Tutoriels » du site officiel d'HyperAI (hyper.ai).Le déploiement en un clic vous permet de l'expérimenter en ligne. Saisissez simplement les instructions de la tâche biomédicale pour lancer le processus d'analyse automatisé. Venez l'expérimenter !Lien du tutoriel :
Nous avons également préparé des avantages surprises pour les nouveaux utilisateurs inscrits. Utilisez le code d'invitation « Biomni » pour vous inscrire sur la plateforme OpenBayes et bénéficier de 5 heures d'utilisation gratuite de la carte graphique RTX A6000 (valable 1 mois). Quantité limitée, premier arrivé, premier servi !
Essai de démonstration
1. Après avoir accédé à la page d'accueil de hyper.ai, sélectionnez la page « Tutoriels », sélectionnez « Biomni : le premier agent biomédical universel » et cliquez sur « Exécuter ce tutoriel en ligne ».


2. Une fois la page affichée, cliquez sur « Cloner » dans le coin supérieur droit pour cloner le didacticiel dans votre propre conteneur.

3. Sélectionnez « NVIDIA RTX A6000 » et l'image « vllm ». La plateforme OpenBayes propose quatre modes de facturation : « à l'utilisation » ou « quotidien/hebdomadaire/mensuel » selon vos besoins. Cliquez sur « Continuer ». Les nouveaux utilisateurs peuvent s'inscrire via le lien d'invitation ci-dessous pour obtenir 4 heures de RTX 4090 et 5 heures de CPU gratuit !
Lien d'invitation exclusif HyperAI (copier et ouvrir dans le navigateur) :
https://openbayes.com/console/signup?r=Ada0322_NR0n


4. Attendez que les ressources soient allouées. Le premier clonage prendra environ 2 minutes. Lorsque le statut passe à « En cours d'exécution », cliquez sur « Ouvrir l'espace de travail » pour accéder à la page de démonstration.

5. Double-cliquez sur le nom du projet dans la barre de gauche pour commencer à l'utiliser. Accédez à « 3. Effectuer des tâches biomédicales en langage naturel » et saisissez l'invite.

Démonstration d'effet
Exemple d'invite : Planifiez un écran CRISPR pour identifier les gènes qui régulent l'épuisement des lymphocytes T, générez 32 gènes qui maximisent l'effet de perturbation.
L'effet est le suivant :


Le tutoriel ci-dessus est recommandé par HyperAI. Les lecteurs intéressés sont invités à le découvrir ⬇️
Lien du tutoriel :
https://go.hyper.ai/Mox9F