HyperAI

Online-Tutorial | 150 Professionelle Tools/59 Datenbanken/105 Pakete, Biomni Übertrifft Die Effizienz Eines Experten in 8 Realen Forschungsaufgaben

特色图像

Die moderne biomedizinische Forschung steckt im Widerspruch zwischen Datenexplosion und Effizienzengpass. Einerseits hat die Entwicklung von Technologien wie Gensequenzierung und Einzelzellanalyse massive multimodale Daten hervorgebracht – von genomischen Basensequenzen bis hin zu klinischen Bilddaten, von der Artenvielfalt von Mikrobiomen bis hin zu kleinen Molekülkarten von Metabolomen – der Datenumfang hat ein PB-Niveau erreicht. Andererseits hat die Fragmentierung der Forschungsprozesse die Geschwindigkeit der Entdeckungen stark eingeschränkt: Eine typische Multi-Omics-Analyse kann den Aufruf von mehr als zehn Tools, die Abfrage von Dutzenden von Datenbanken und die Bezugnahme auf Hunderte von Veröffentlichungen erfordern. Diese Aufgaben müssen von Forschern oft manuell erledigt werden, was nicht nur zeitaufwändig, sondern auch fehleranfällig ist.

Die meisten vorhandenen KI-Tools sind jedoch „spezialisiert“, wie etwa Modelle, die sich auf das CRISPR-Experimentdesign oder die Annotation einzelner Zellen konzentrieren.Sie können nur eine einzige Aufgabe bewältigen und haben Schwierigkeiten, domänenübergreifend zusammenzuarbeiten.Wenn die Forschung die Schnittstelle zwischen Genetik und Pharmakologie betrifft oder klinische Daten mit Ergebnissen der Grundlagenforschung verknüpft werden müssen, sind diese Werkzeuge nicht leistungsfähig. Daher ist die Entwicklung eines allgemeinen biomedizinischen intelligenten Agenten, der grenzüberschreitend denken und wie menschliche Wissenschaftler autonome Entscheidungen treffen kann, der Schlüssel zur Lösung des aktuellen Forschungsdilemmas.

In diesem ZusammenhangDie Stanford University hat in Zusammenarbeit mit Genentech, Arc Institute, UCSF und anderen Institutionen den ersten universellen biomedizinischen KI-Agenten, Biomni, entwickelt.Es kann autonom eine breite Palette von Forschungsaufgaben in verschiedenen biomedizinischen Teilgebieten durchführen und den ersten einheitlichen Umweltagenten erstellen – indem es die notwendigen Werkzeuge, Datenbanken und Lösungen aus Zehntausenden von Publikationen in 25 biomedizinischen Bereichen extrahiert. Auf dieser Grundlage verfügt Biomni über eine allgemeine Agentenarchitektur, die Large Language Model (LLM)-Reasoning mit Retrieval-gestützter Planung und codebasierter Ausführung kombiniert. Dadurch kann Biomni komplexe biomedizinische Arbeitsabläufe dynamisch erstellen und ausführen, ohne auf vordefinierte Vorlagen oder strenge Aufgabenprozesse angewiesen zu sein. System-Benchmarks zeigen, dass Biomni eine starke Generalisierung bei heterogenen biomedizinischen Aufgaben ohne aufgabenspezifisches Prompt-Tuning erreicht.

Papieradresse:

https://go.hyper.ai/Vt5CD

Link zum Ein-Klick-Bereitstellungstutorial:

https://go.hyper.ai/Mox9F

Das Hauptziel von Biomni besteht darin, einen allgemeinen biomedizinischen KI-Agenten zu entwickeln, der keine vordefinierte Vorlage benötigt, sodass er domänenübergreifende Forschungsaufgaben autonom erledigen kann.Konkret umfasst es drei Aspekte der Fähigkeiten:

* Aufgabenspezifische Einschränkungen durchbrechen:Biomni hofft, eine Vielzahl von Aufgaben von der „Diagnose seltener Krankheiten“ bis zur „Analyse von Mikrobiomunterschieden“ allein mithilfe von Anweisungen in natürlicher Sprache bewältigen zu können.

Integration multimodaler Fähigkeiten:Erschließen Sie den gesamten Prozess von den Daten bis zum Experiment. Der geschlossene Kreislauf der biomedizinischen Forschung besteht aus „Dateneingabe → Analyse und Argumentation → Hypothesenentwicklung → Versuchsplanung → Ergebnisüberprüfung“. Biomni muss alle diese Schritte abdecken – es kann Daten tragbarer Geräte im Excel-Format und Einzelzelldaten im h5ad-Format verarbeiten, Python-Code für die Analyse generieren und PCR-Experimente zur Hypothesenüberprüfung entwerfen.

Etablierung eines neuen Paradigmas der Mensch-Maschine-Zusammenarbeit:Biomni ist nicht darauf ausgerichtet, Wissenschaftler zu ersetzen, sondern ein „Superassistent“ zu werden, der wiederkehrende Aufgaben wie Datenbereinigung und Literaturrecherche automatisch erledigt, sodass sich Forscher auf die Hypothesenkonstruktion und innovatives Design konzentrieren können.

Datensatz: Dreischichtiger Datensatz zum Aufbau einer biomedizinischen Wissensbasis

Die leistungsstarken Funktionen von Biomni beruhen auf der systematischen Integration biomedizinischer Forschungsressourcen. Durch den Aufbau eines dreischichtigen Datensatzes hat das Team ein „digitales Labor“ für KI geschaffen, das Tools, Daten und Aufgaben umfasst.

Um die grundlegenden operativen Einheiten der biomedizinischen Forschung zu definieren,Das Team wählte aus jeder der 25 Themenkategorien von bioRxiv (wie Genomik, Mikrobiologie und Pharmakologie) die 100 neuesten im Jahr 2024 veröffentlichten Artikel aus.Mithilfe des „Action Discovery Agent“ wird der Forschungsprozess Schritt für Schritt analysiert und vier Kernelemente extrahiert: Aufgaben, Tools, Softwarepakete und Datenbanken. Die Datenbank enthält 59 Kernressourcen, die in zwei Kategorien unterteilt sind: große Datenbanken, auf die über eine API zugegriffen werden kann (z. B. PDB zur Speicherung von Proteinstrukturen und ClinVar, eine Datenbank für klinische Variationen) und lokal bereitgestellte strukturierte Datensätze (z. B. GWAS-Zusammenfassungsstatistiken und Mikrobiom-Referenzgenome).

Zweitens erstellte das Team zur Überprüfung der Generalisierungsfähigkeit einen mehrstufigen Bewertungsdatensatz: einen allgemeinen Wissensbenchmark und einen realen Aufgabensatz.Zu den Benchmarks für allgemeines Wissen gehören LAB-Bench (einschließlich Beantwortung von DbQA-Datenbankfragen und SeqQA-Sequenzschlussfolgerung) und Humanity's Last Exam (deckt 14 biomedizinische Teilbereiche ab).Diese Datensätze sind nicht auf spezifische Tools angewiesen und konzentrieren sich auf die Untersuchung der grundlegenden Denkfähigkeiten von KI. Der reale Aufgabensatz enthält acht domänenübergreifende Aufgaben, die jeweils einem tatsächlichen Forschungsszenario entsprechen.

Um den praktischen Anwendungswert zu demonstrieren,Das Team wählte drei Arten typischer Daten als Fallstudiendaten aus:

* Daten tragbarer Geräte: 458 Excel-Dateien von 30 Teilnehmern, darunter kontinuierliche Glukoseüberwachung (CGM) und Temperaturdaten (2 Stunden vor den Mahlzeiten bis 4 Stunden nach den Mahlzeiten) und Schlafaufzeichnungen von 227 Nächten (einschließlich Schlafdauer, -effizienz, -stadium usw.);

* Multi-Omics-Daten: Einzelzell-Datensatz zur Entwicklung des menschlichen embryonalen Skeletts (snRNA-seq- und snATAC-seq-Daten von 336.000 Zellkernen) sowie Multi-Omics-Daten von 652 Lipiden, 731 Metaboliten und 1.470 Proteinen;

* Nasse Experimentdaten: 10 Klonierungsaufgaben (einschließlich Golden Gate, Gibson und anderer Methoden) sowie CRISPR-Vektorkonstruktionsexperimente mit Fokus auf das B2M-Gen, die zur Überprüfung des von Biomni entworfenen Versuchsplans verwendet wurden.

Modellarchitektur: Dual-Engine-Design und intelligenter Kollaborationsmechanismus

Biomni besteht aus zwei Hauptkomponenten: Biomni-E1, einer grundlegenden biomedizinischen Umgebung mit einem einheitlichen Aktionsraum, und Biomni-A1, einem Agenten, der diese Umgebung effektiv nutzen soll.

* Biomni-E1 ist keine einfache Sammlung von Werkzeugen, sondern ein strukturiertes „digitales Labor“, dessen Design den drei Prinzipien Authentizität, Flexibilität und Skalierbarkeit folgen muss. Das heißt, alle Werkzeuge, Software und Datenbanken müssen von Experten verifiziert werden; die Software wird containerisiert bereitgestellt, unterstützt Versionswechsel, Datenbankabfragen unterstützen die Eingabe in natürlicher Sprache; reservierte Schnittstellen ermöglichen das Hinzufügen neuer Werkzeuge.

Biomni-A1 ist das „Entscheidungszentrum“ der allgemeinen Intelligenz. Seine Architektur durchbricht das „Input-Output“-Modell traditioneller KI. Es verfügt über einen Problemlösungsprozess, der dem menschlicher Wissenschaftler ähnelt, und führt eine dynamische Werkzeugauswahl auf Basis von Retrieval-optimierter Planung durch. Es nutzt Code als universelle Schnittstelle und unterstützt komplexe Logik wie Schleifen, Parallelität und bedingte Urteile. Es unterstützt adaptive Planung. Der anfängliche Plan wird basierend auf Wissen generiert und kann während der Ausführung anhand von Feedback angepasst werden.

Biomni – Übersicht über einheitlichen biomedizinischen Aktionsraum und Agentenumgebung

Experimentelles Fazit: Hervorragende Leistung vom Benchmarktest bis zur Nasslabor-Verifizierung

Die Leistung von Biomni wurde durch mehrstufige Experimente überprüft und die Ergebnisse zeigten nicht nur technologische Durchbrüche, sondern enthüllten auch den praktischen Wert der allgemeinen biomedizinischen KI.

In standardisierten Benchmarktests zeigte Biomni deutliche Vorteile:

Im LAB-Bench-TestDie Genauigkeit der Datenbank-Fragenbeantwortung (DbQA) erreichte 74,41 TP3T, was mit menschlichen Experten (74,71 TP3T) vergleichbar ist und den Codieragenten (40,81 TP3T) bei weitem übertrifft; die Genauigkeit der Sequenzschlussfolgerung (SeqQA) erreichte 81,91 TP3T und übertraf damit das menschliche Niveau (78,81 TP3T), was darauf hindeutet, dass seine Fähigkeit zur Verarbeitung strukturierter Daten und biologischer Sequenzen der von professionellen Forschern nahe kommt.

Im HLE-Test52 Fragen aus 14 Bereichen wurden ausgewertet. Die Genauigkeit betrug 17,31 TP3T, was dem 2,9-Fachen des Basis-LLM (6,01 TP3T) und dem 1,3-Fachen des Kodieragenten (12,81 TP3T) entspricht. Es ist erwähnenswert, dass HLE keine Entwicklungssatzoptimierung aufweist und die Fähigkeit zur Nullstichproben-Generalisierung vollständig testet. Die Ergebnisse zeigen, dass Biomni unbekannte domänenübergreifende Probleme bewältigen kann.

Darüber hinaus werden in 8 realen AufgabenDie durchschnittliche Leistung von Biomni übertrifft den Basiswert bei weitem: 402,31 TP3T höher als beim Basis-LLM, 43,01 TP3T höher als beim Codierungsmittel und 20,41 TP3T höher als bei der Variante, die nur ReAct-Kettenschlussfolgerung verwendet (Biomni-ReAct). Bei der Segmentierungsaufgabe erreichte die Genauigkeit der GWAS-Kausalgenerkennung 68,31 TP3T (der Durchschnitt menschlicher Experten liegt bei 71,21 TP3T), die semantische Übereinstimmungsrate der Einzelzellanmerkungen betrug 89,71 TP3T und der klinische Ausrichtungswert der Arzneimittelneupositionierung betrug 0,78 (volle Punktzahl 1,0).

Zero-Shot-Generalisierbarkeit von Biomni auf verschiedene reale biomedizinische Aufgaben

Kurz gesagt: Biomni durchbricht die Beschränkungen traditioneller KI im biomedizinischen Bereich, die auf „besondere Menschen für besondere Aufgaben“ schließen lassen, und realisiert den gesamten Prozess des autonomen Betriebs von der Genregulationsnetzwerkanalyse bis hin zur Nassexperimentplanung. Dies ist nicht nur eine Innovation auf technischer Ebene, sondern auch eine Vision einer Zukunft, in der virtuelle KI-Biologen Seite an Seite mit menschlichen Wissenschaftlern arbeiten und deren Fähigkeiten erweitern.

derzeit,„Biomni: Der erste universelle biomedizinische intelligente Agent“ wurde im Abschnitt „Tutorials“ der offiziellen Website von HyperAI (hyper.ai) veröffentlicht.Mit der Ein-Klick-Bereitstellung können Sie es online erleben. Geben Sie einfach die Anweisungen zur biomedizinischen Aufgabe ein, um den automatisierten Analyseprozess zu starten. Kommen Sie und erleben Sie es!Link zum Tutorial:

https://go.hyper.ai/Mox9F

Wir haben auch Überraschungsvorteile für neu registrierte Benutzer vorbereitet. Registrieren Sie sich mit dem Einladungscode „Biomni“ auf der OpenBayes-Plattform und erhalten Sie 5 Stunden kostenlose Nutzung der RTX A6000 (die Ressource ist einen Monat lang gültig). Die Anzahl ist begrenzt, wer zuerst kommt, mahlt zuerst!

Demolauf

1. Nachdem Sie die Homepage von hyper.ai aufgerufen haben, wählen Sie die Seite „Tutorials“, wählen Sie „Biomni: The First Universal Biomedical Agent“ und klicken Sie auf „Dieses Tutorial online ausführen“.

2. Klicken Sie nach dem Seitensprung oben rechts auf „Klonen“, um das Tutorial in Ihren eigenen Container zu klonen.

3. Wähle „NVIDIA RTX A6000“ und das „vllm“-Image aus. Die OpenBayes-Plattform bietet vier Abrechnungsmethoden. Du kannst je nach Bedarf zwischen „Pay as you go“ oder „täglich/wöchentlich/monatlich“ wählen. Klicke auf „Weiter“. Neue Nutzer können sich über den unten stehenden Einladungslink registrieren und erhalten 4 Stunden RTX 4090 + 5 Stunden CPU-freie Zeit!

Exklusiver Einladungslink von HyperAI (kopieren und im Browser öffnen):
https://openbayes.com/console/signup?r=Ada0322_NR0n

4. Warten Sie, bis die Ressourcen zugewiesen sind. Der erste Klon dauert etwa 2 Minuten. Wenn der Status auf „Läuft“ wechselt, klicken Sie auf „Arbeitsbereich öffnen“, um zur Demoseite zu gelangen.

5. Doppelklicken Sie auf den Projektnamen in der linken Verzeichnisleiste, um es zu verwenden. Führen Sie den Befehl „3. Führen Sie biomedizinische Aufgaben in natürlicher Sprache aus“ aus und geben Sie die Eingabeaufforderung ein.

Effektdemonstration

Beispielaufforderung: Planen Sie einen CRISPR-Screen, um Gene zu identifizieren, die die Erschöpfung der T-Zellen regulieren, und generieren Sie 32 Gene, die den Störungseffekt maximieren.

Die Wirkung ist wie folgt:

Das obige Tutorial wird von HyperAI empfohlen. Interessierte Leser sind herzlich eingeladen, es auszuprobieren ⬇️

Link zum Tutorial:
https://go.hyper.ai/Mox9F