HyperAI超神経

オンラインチュートリアル | 150種類の専門ツール/59種類のデータベース/105種類のパッケージを備えたBiomniは、8つの実際の研究タスクで専門家レベルの効率性を達成しました

特色图像

現代のバイオメディカル研究は、「データ爆発と効率ボトルネック」という矛盾に陥っています。一方では、遺伝子配列解析や単細胞解析といった技術の発展により、ゲノム塩基配列から臨床画像データ、マイクロバイオームの種多様性からメタボロームの小分子マップに至るまで、膨大なマルチモーダルデータが生成され、そのデータ規模はペタバイト(PB)レベルに達しています。他方では、研究プロセスの断片化が発見のスピードを著しく制限しています。典型的なマルチオミクス解析では、10以上のツールの呼び出し、数十のデータベースへのクエリ、数百の論文の参照が必要となる場合があり、これらの作業は多くの場合、研究者が手作業で完了させる必要があり、時間がかかるだけでなく、エラーが発生しやすいという問題もあります。

しかし、既存の AI ツールのほとんどは、CRISPR 実験設計や単一細胞の注釈に重点を置いたモデルなど、「特化」しています。単一のタスクしか処理できず、ドメイン間での連携が困難です。遺伝学と薬理学の交差点を研究する場合、あるいは臨床データと基礎研究の結果を統合する必要がある場合、これらのツールは役に立ちません。そのため、人間の科学者のように境界を越えて思考し、自律的な意思決定を行うことができる汎用的なバイオメディカルインテリジェントエージェントを構築することが、現在の研究のジレンマを打破する鍵となっています。

この点について、スタンフォード大学は、ジェネンテック、アーク研究所、UCSFなどの機関と共同で、初の汎用バイオメディカルAIエージェント「Biomni」を開発した。Biomniは、様々な生物医学分野にまたがる幅広い研究タスクを自律的に実行し、25の生物医学分野における数万件の出版物から必要なツール、データベース、ソリューションをマイニングする、世界初の統合環境エージェントを構築できます。この基盤に基づき、Biomniは大規模言語モデル(LLM)推論と検索強化型プランニング、そしてコードベースの実行を組み合わせた汎用エージェントアーキテクチャを備えており、事前定義されたテンプレートや厳格なタスクプロセスに依存せずに、複雑な生物医学ワークフローを動的に構築・実行できます。システムベンチマークでは、Biomniがタスク固有のプロンプト調整なしに、異種生物医学タスクにおいて強力な汎化を実現していることが示されています。

用紙のアドレス:

https://go.hyper.ai/Vt5CD

ワンクリック展開チュートリアルのリンク:

https://go.hyper.ai/Mox9F

Biomni の主な目標は、事前定義されたテンプレートを必要とせず、ドメイン間の研究タスクを自律的に完了できる汎用バイオメディカル AI エージェントを開発することです。具体的には、次の 3 つの機能側面が含まれます。

* タスク固有の制限を突破する:Biomni は、自然言語の指示のみを使用して、「希少疾患の診断」から「マイクロバイオームの差異分析」まで、さまざまなタスクを処理できるようになることを目指しています。

マルチモーダル機能の統合:データから実験までのプロセス全体をオープン化します。バイオメディカル研究の閉ループは、「データ入力 → 分析と推論 → 仮説生成 → 実験設計 → 結果検証」です。Biomniは、これらのすべてのリンクをカバーする必要があります。ウェアラブルデバイスのExcel形式のデータとh5ad形式の単一細胞データを処理し、分析用のPythonコードを生成し、仮説検証のためのPCR実験を設計します。

人間と機械のコラボレーションの新しいパラダイムを確立する:Biomni の位置付けは、科学者に代わることではなく、データのクリーニングや文献の検索などの反復的なタスクを自動的に完了し、研究者が仮説の構築と革新的な設計に集中できるようにする「スーパーアシスタント」になることです。

データセット: 生物医学知識ベースを構築するための3層データセット

Biomniの強力な機能は、生物医学研究リソースの体系的な統合から生まれます。3層のデータセットを構築することで、チームはツール、データ、タスクを網羅するAIのための「デジタルラボ」を構築しました。

生物医学研究の基本的な運用単位を定義するために、チームは、bioRxiv の 25 の分野カテゴリ (ゲノミクス、微生物学、薬理学など) のそれぞれから、2024 年に公開された最新の論文 100 件を選択しました。「アクションディスカバリーエージェント」を通じて、研究プロセスを一つ一つ分析し、タスク、ツール、ソフトウェアパッケージ、データベースという4つのコア要素を抽出します。データベースには59のコアリソースが含まれており、APIでアクセスできる大規模データベース(タンパク質構造を格納するPDBや臨床変異データベースClinVarなど)と、ローカルに展開された構造化データセット(GWASサマリー統計やマイクロバイオーム参照ゲノムなど)の2つのカテゴリに分類されます。

次に、一般化能力を検証するために、チームは一般知識ベンチマークと現実世界のタスクセットという多段階の評価データセットを構築しました。一般知識ベンチマークには、LAB-Bench(DbQA データベースの質問回答と SeqQA シーケンス推論を含む)と Humanity's Last Exam(14 の生物医学サブフィールドをカバー)が含まれます。これらのデータセットは特定のツールに依存せず、AIの基本的な推論能力の検証に重点を置いています。実世界タスクセットには、実際の研究シナリオに対応する8つのクロスドメインタスクが含まれています。

実用的な応用価値を示すために、チームは、ケーススタディ データとして次の 3 種類の典型的なデータを選択しました。

* ウェアラブルデバイスのデータ: 持続血糖モニタリング (CGM) と体温データ (食前 2 時間から食後 4 時間まで)、227 泊の睡眠記録 (睡眠時間、効率、段階などを含む) を含む、参加者 30 人からの 458 個の Excel ファイル。

* マルチオミクスデータ:ヒト胎児骨格発達の単一細胞データセット(336,000個の核のsnRNA-seqおよびsnATAC-seqデータ)、および652の脂質、731の代謝物、1,470のタンパク質のマルチオミクスデータ。

* ウェット実験データ: Biomni が設計した実験計画の検証に使用された、10 個のクローニングタスク (Golden Gate、Gibson およびその他の方法をカバー) と、B2M 遺伝子をターゲットにした CRISPR ベクター構築実験。

モデルアーキテクチャ:デュアルエンジン設計とインテリジェントなコラボレーションメカニズム

Biomni は、統一されたアクション スペースを備えた基本的なバイオメディカル環境である Biomni-E1 と、この環境を効果的に活用するように設計されたエージェントである Biomni-A1 という 2 つの主要コンポーネントで構成されています。

* Biomni-E1は単なるツールの集合体ではなく、構造化された「デジタルラボ」です。その設計は、信頼性、柔軟性、拡張性という3つの原則に従う必要があります。つまり、すべてのツール、ソフトウェア、データベースは専門家によって検証され、ソフトウェアはコンテナ化された方法で展開され、バージョン切り替えをサポートし、データベースクエリは自然言語入力をサポートし、予約されたインターフェースは新しいツールの追加をサポートします。

* Biomni-A1は汎用知能の「意思決定センター」です。そのアーキテクチャは従来のAIの「入出力」モデルを突破し、人間の科学者に類似した問題解決プロセスを備え、検索強化型プランニングに基づく動的なツール選択を実行します。コードを汎用インターフェースとして利用し、ループ、並列処理、条件判断などの複雑なロジックをサポートします。適応型プランニングをサポートし、知識に基づいて初期プランを生成し、実行中のフィードバックに応じて調整できます。

Biomni統合バイオメディカルアクションスペースとエージェント環境の概要

実験的結論: ベンチマークテストからウェットラボ検証まで優れたパフォーマンス

Biomniの性能は多段階の実験を通じて検証され、その結果は技術的なブレークスルーを実証しただけでなく、一般的なバイオメディカルAIの実用的価値も明らかにしました。

標準化されたベンチマークテストでは、Biomni は大きな利点を示しました。

LABベンチテストでは、データベース質問応答(DbQA)の精度は74.4%に達し、これは人間の専門家(74.7%)に匹敵し、コーディングエージェント(40.8%)をはるかに上回ります。配列推論(SeqQA)の精度は81.9%に達し、人間のレベル(78.8%)を超え、構造化データと生物学的配列を処理する能力がプロの研究者の能力に近いことを示しています。

HLEテストでは、14分野をカバーする52問の質問が評価され、精度は17.3%でした。これは、基本LLM(6.0%)の2.9倍、エンコードエージェント(12.8%)の1.3倍です。注目すべきは、HLEには開発セットのチューニングが含まれておらず、ゼロサンプル汎化能力を完全にテストしていることです。この結果は、Biomniが未知のクロスドメイン問題に対応できることを示しています。

さらに、8つの実際のタスクでは、Biomniの平均性能はベースラインを大きく上回り、基本LLMより402.3%、エンコードエージェントより43.0%、ReAct連鎖推論のみを用いたバリアント(Biomni-ReAct)より20.4%高くなりました。セグメンテーションタスクでは、GWASによる原因遺伝子検出の精度は68.3%(人間の専門家の平均は71.2%)、シングルセルアノテーションの意味的一致率は89.7%、薬物再配置の臨床アライメントスコアは0.78(満点1.0)でした。

多様な実世界の生物医学的タスクにおけるBiomniのゼロショット一般化可能性

つまり、Biomniは、バイオメディカル分野における従来のAIの「特別なポストには特別な人材」という制約を打ち破り、遺伝子制御ネットワーク解析からウェット実験設計までの全プロセスを自律的に操作することを実現します。これは技術レベルの革新であるだけでなく、仮想AI生物学者が人間の科学者と肩を並べて働き、人間の科学者の能力を高めるという未来のビジョンでもあります。

現在のところ、「Biomni: 初のユニバーサルバイオメディカルインテリジェントエージェント」が、HyperAI 公式サイト (hyper.ai) の「チュートリアル」セクションで公開されました。ワンクリックでオンラインで体験できます。バイオメディカルタスクの指示を入力するだけで、自動分析プロセスが開始されます。ぜひご体験ください!チュートリアルのリンク:

https://go.hyper.ai/Mox9F

新規登録ユーザーの皆様には、サプライズ特典をご用意いたしました。招待コード「Biomni」を使用してOpenBayesプラットフォームにご登録いただくと、RTX A6000を5時間無料でご利用いただけます(リソースの有効期限は1ヶ月です)。数量限定のため、先着順となります。

デモの実行

1. hyper.ai ホームページにアクセスした後、「チュートリアル」ページを選択し、「Biomni: The First Universal Biomedical Agent」を選択して、「このチュートリアルをオンラインで実行」をクリックします。

2. ページがジャンプしたら、右上隅の「クローン」をクリックしてチュートリアルを独自のコンテナにクローンします。

3. 「NVIDIA RTX A6000」と「vllm」イメージを選択します。OpenBayesプラットフォームでは4つの課金方法をご用意しています。ニーズに合わせて「従量課金制」または「日次/週次/月次」からお選びいただけます。「続行」をクリックしてください。新規ユーザーは、以下の招待リンクから登録すると、RTX 4090を4時間分とCPUを5時間無料でご利用いただけます。

HyperAI ハイパーニューラルの専用招待リンク (ブラウザに直接コピーして開きます):
https://openbayes.com/console/signup?r=Ada0322_NR0n

4. リソースが割り当てられるのを待ちます。最初のクローン作成には約2分かかります。ステータスが「実行中」に変わったら、「ワークスペースを開く」をクリックしてデモページに移動します。

5. 左側のディレクトリバーにあるプロジェクト名をダブルクリックして使用を開始します。「3. 自然言語を用いた生物医学タスクの実行」まで実行し、プロンプトを入力します。

効果実証

プロンプトの例: T 細胞の枯渇を制御する遺伝子を特定するための CRISPR スクリーンを計画し、摂動効果を最大化する 32 個の遺伝子を生成します。

効果は以下のとおりです。

上記はHyperAIが推奨するチュートリアルです。ご興味のある方はぜひお試しください⬇️

チュートリアルのリンク:
https://go.hyper.ai/Mox9F