Command Palette
Search for a command to run...
わずか30分で、生物学的マルチエージェントであるRobinは550件の研究論文を統合し、自律的な研究ループを確立して、びまん性加齢黄斑変性症(dAMD)の候補治療法を特定した。

生物学的検出、摂動実験、計算モデリング技術の継続的な成熟に伴い、生命科学研究の精度と規模は急速に向上している。しかし、急速に増大するデータ生成能力に比べて、知識統合や科学的推論における研究システムのインテリジェントな能力は著しく遅れている。膨大な量の貴重な情報は、論文、データベース、実験結果などに散在している。手作業による分類は非効率的なだけでなく、異なる分野にわたる既存の結論を結びつけることも困難にする。このため、多くの検証済みの研究結果が、タイムリーに新たな研究アイデアや臨床プロトコルに結び付けられないという事態が生じている。
この「知識の断片化」という問題は、「薬剤の用途変更」の分野で特に顕著である。ダブラフェニブの耳保護効果が後に発見されたケースや、ケタミンの新たな治療価値が拡大されたケースなど、いずれも数年、あるいは数十年もの実用化の遅れが生じており、これは科学研究プロセスにおける知識の発見と統合における現在のボトルネックを反映している。
近年、大規模コーパスでのトレーニングを通じて開発された検索、帰納、論理的推論機能を備えた大規模言語モデル(LLM)は、生命科学研究においてその可能性を示し始めています。ファインチューニング、検索強化生成(RAG)、マルチエージェントコラボレーション技術を組み合わせることで、これらのモデルは、文献分析、薬剤予測、科学的仮説生成などの個々のタスクにおいて人間のパフォーマンスを達成、あるいは凌駕しています。しかし、既存のAIツールのほとんどは、研究プロセスのごく一部しかカバーしておらず、「仮説生成→実験計画→データ分析→結果の反復」という一連の流れ全体を真に繋げることはできない。したがって、真に閉ループ型のインテリジェントな科学研究はまだ実現できていない。
この問題に対処するため、サンフランシスコのFutureHouse、オックスフォード大学、フォーダム大学の共同チームが、ロビンという生物学的マルチエージェントシステムを提案した。これは、科学的仮説の生成能力と実験データの分析能力を同時に統合し、継続的な閉ループワークフローを実現する、初の生物医学インテリジェントシステムである。
Robinは、文献検索エージェントとデータ分析エージェントの協調動作により、疾患メカニズム分析、候補薬スクリーニング、実験レビュー、仮説反復を半自律的に完了できる。研究チームは、治療選択肢が限られ、臨床ニーズが切迫している疾患である加齢黄斑変性症(dAMD)を応用シナリオとして用い、インテリジェントな薬剤スクリーニングにおけるRobinの能力を検証し、AI主導の新薬開発と薬剤再利用のための新たな実践的パラダイムを提示した。
「科学的発見を自動化するためのマルチエージェントシステム」と題された関連研究成果は、科学誌『ネイチャー』に掲載された。
研究のハイライト:
* Robinシステムは、文献に基づく仮説生成と生物学的実験データの分析を、連続的なクローズドループワークフローに統合した初のシステムです。
* Robinは、学際的な科学研究の成果に柔軟に対応できます。治療薬開発の分野では、対象疾患名を入力するだけで、システムが自動的に疾患の主要な病理学的メカニズムをスクリーニングし、in vitro実験モデルとの照合を行い、候補薬を提案し、実験データの解析を完了させ、候補分子を繰り返し更新することができます。
ロビンは、研究例としてdAMDを用い、ROCK阻害剤を用いてRPE細胞の貪食機能を高めることで、ドライ型加齢黄斑変性を治療する新しい戦略を初めて提案した。

論文を見る:
https://www.nature.com/articles/s41586-026-10652-y
データセット:公開文献、バイオインフォマティクスベンチマーク、実験データなどを網羅
本研究では、公開されている文献データ、一般的なバイオインフォマティクスベンチマークデータ、および自己実験データから構成される3層構造のデータシステムを構築した。文献調査、バイオインフォマティクス解析、細胞検出、トランスクリプトームシーケンスなど、さまざまな種類のタスクを網羅しています。これは基本的に、AIを用いた医薬品開発プロセスにおける主要なデータシナリオを網羅しています。
まず、研究者たちは、dAMDに関連する中国語と英語の科学研究論文551件を、システムが科学的仮説を生成するための知識ベースとして統合した。これには、疾患メカニズムに関する研究151件と、網膜色素上皮細胞の貪食機能および疾患との関連性に関する研究論文400件が含まれる。この文献は、疾患メカニズムの解明に役立つだけでなく、試験管内実験モデルのスクリーニングや、既存薬の用途変更のための候補薬の創出に関する理論的基盤も提供する。これは、ロビンの知識マイニング活動の中核を成す情報源である。
第二に、研究者らは、汎用的なバイオインフォマティクスベンチマークデータセットであるBixBenchを用いて、システムのデータ分析能力を定量的に評価した。この研究では、医薬品開発に関連する170のテスト問題を選定した。本テストは、トランスクリプトーム解析、ゲノミクス、機能濃縮解析、配列解析、統計的検定など、さまざまなタスクタイプを網羅しています。すべての問題には、標準化されたデータパッケージ、標準解答、および誤答選択肢が付属しており、これらを用いて、実際のバイオインフォマティクスシナリオにおけるエージェントの適応性と安定性を体系的に評価できます。
また、研究者らはまた、モデルの反復と実験的検証を現実世界で裏付けるために、独自の実験データセットを構築した。このデータには、ARPE-19細胞およびヒト初代網膜色素上皮幹細胞のフローサイトメトリー結果、複数の薬剤処理後のRNAシーケンス転写産物データ、細胞毒性、免疫細胞化学染色、およびVEGF酵素結合免疫吸着アッセイの結果が含まれています。ヒト細胞サンプルはニューヨーク・ビジョン・リペア・アイバンクから入手したもので、すべて60歳以上の眼疾患のないドナー由来の網膜色素上皮幹細胞であり、実験データの信頼性と臨床的参考価値が保証されています。
Robin: 生物医学科学発見のためのマルチエージェントシステム
Aviaryフレームワークをベースとし、Jupyter Notebook環境で動作するRobinは、単一のタスクしか実行しない従来の研究用AIツールとは異なり、「科学的仮説の生成→実験分析→結果のフィードバック→仮説の反復」という、連続的なクローズドループワークフローを実現した初のAIツールです。疾患メカニズムの研究、候補薬のスクリーニング、実験データの分析など、科学研究プロセス全体を半自律的に完了することができる。

本システムは、2つの文書エージェントと1つのデータ分析エージェントが連携して動作する「3エージェント」の中核アーキテクチャを採用している。
で、文書情報エージェントであるクロウとファルコンは、主に文書からの知識抽出と科学的仮説の生成を担当する。どちらもOpenAIのo4-miniモデルをベースとしています。Crowは、疾患関連文献の検索、病理学的メカニズムの分析、実験モデルのスクリーニング、および予備的な薬剤候補の発見を担当します。断片化された研究を体系的に統合し、重要な科学的結論を抽出することができます。Falconは、詳細な検証と最適化を担当します。さらに、Crowが提案した候補ソリューションの薬理学的メカニズム、理論的根拠、および潜在的な限界を分析し、文献中の誤った引用を修正することで、大規模モデルの「錯覚」問題を軽減します。
3つ目のコアモジュールであるFinchは、生物学的実験データの分析のために特別に設計されたインテリジェントエージェントである。従来の固定された解析スクリプトに依存するツールとは異なり、Finchは生成推論を採用し、実験データの特性に基づいてPythonまたはRコードをリアルタイムで生成・実行します。これにより、フローサイトメトリー解析、RNA-seqの差次的発現解析、遺伝子機能エンリッチメントなどのタスクを適応的に実行できます。つまり、このシステムはもはや事前に定義された解析ワークフローに限定されず、研究者のように解析戦略を動的に調整できるのです。
データ分析における大規模モデルのランダム性を低減するために、ロビンはさらに、「マルチ軌道解析+コンセンサス統合」メカニズムを設計した。本システムは、8つの独立したフィンチ解析軌跡を同時に実行できます。各軌跡は、コード生成、データ解析、および結果出力をそれぞれ独立して実行します。最後に、複数の軌跡の結論をメタ解析によって統合することで、単一ラウンド解析における変動やパラメータの違いによる誤差を低減し、結果の安定性を向上させます。
評価メカニズムに関して、ロビンは2段階の大規模モデルレビューシステムも導入した。このシステムは、Anthropic社のClaude 3.7 Sonnetをコアとなるレビューモデルとして使用し、ドメインエキスパートの好みに合わせるためにGoogle Gemini 2.5 Proと組み合わせています。候補となる作用機序、実験モデル、および薬剤投与レジメンは、ペアワイズ比較とトーナメントランキングによって階層的に評価されます。評価対象となるレジメンの数が少ない場合は、完全なペアリングが用いられ、数が多い場合は、ランダムサンプリングが比較に用いられます。加重ランキングの算出には、計算コストを抑えつつ評価精度を確保するために、ブラッドリー・テリー・ルースモデルが使用されます。
さらに、解析プロセスの再現性を確保するため、Finchのすべてのタスクは独立したDockerコンテナ環境で実行され、完全なバイオインフォマティクスツールチェーンがプリインストールされています。研究チームはまた、複数回のPromptエンジニアリングを通じてワークフローを最適化および簡素化し、複雑な元のプロセスを安定した使いやすいJupyterワークフローに圧縮することで、研究シナリオにおけるシステムの操作性をさらに向上させました。
ロビンは、リパスジルが貪食能力を1.89倍に高めることを発見した。
本研究は、dAMDを主要な応用シナリオとして焦点を当て、Robinの仮説生成能力、データ分析能力、アーキテクチャの有効性、および実際の薬剤開発効率に関する複数の検証実験を設計する。
中核となる実験は、候補薬のスクリーニングと作用機序の検証に焦点を当てている。 ロビンは文献分析を通して、まずdAMDの主要な病原メカニズムを10個特定し、「網膜色素上皮細胞の貪食機能を強化すること」を治療の核心的な方向性として決定した。第1段階のスクリーニングで、システムは30種類の候補薬を提案した。研究者らはその中からエキセナチド、フィンゴリモド、Y-27632などの薬剤を選択し、実験を行った。また、既知の有効性薬剤であるMFGE8を陽性対照として使用した。

その後、ロビンは独自にトランスクリプトームシーケンスの実験プロトコルを提案し、フィンチがデータ解析を完了した。その結果、Y-27632はアクチン細胞骨格、オートファジー経路、および主要な脂質輸送遺伝子ABCA1を調節することにより、網膜色素上皮細胞のトランスクリプトーム再プログラミングを達成できることが示され、これまで知られていなかった作用機序が明らかになった。
薬剤スクリーニングの臨床的意義をさらに高めるため、本研究ではその後、薬剤反復実験の第2ラウンドを実施した。 ロビンは新たに10種類の薬剤候補を追加し、市販の緑内障治療薬であるリバスジルがY-27632よりも効果的であり、細胞の貪食能力を約1.89倍増加させることを発見した。研究チームは次に、実際の生理環境に近いヒト初代網膜色素上皮幹細胞を用いて再スクリーニングを行った。その結果、リバスジルとY-27632の用量依存的な効果が改めて確認され、リバスジルには明らかな細胞毒性がなく、臨床応用への高い可能性が示された。

特筆すべきは、ロビンが概日リズム調節因子KL001が貪食機能を高める可能性も秘めていることを発見し、dAMD治療のための新たな研究方向性を示したことである。その後のトランスクリプトーム検証により、リパスジルがABCA1の発現を安定的に上方制御できることがさらに確認され、その作用機序の中核が明らかになった。

競合する汎用AI研究システムとの比較において、研究チームは同じ指示を用いてOpenAI Deep Research Agentを呼び出した。生成された17種類の候補薬はいずれも貪食促進活性を示さず、ROCK阻害の核心的なメカニズムも特定できなかった。これは、特定の生物医学的シナリオにおけるRobinの適応性の高さを改めて示す結果となった。
さらに、BixBenchベンチマークテストでは、Finchエージェントの全体的な精度は22.8±1.7%に達し、これは純粋な大規模言語モデルの1.6±1.2%よりも有意に高い値である。生物統計タスクの精度は47.9 ± 1.51 TP3T、基本的なフローサイトメトリー解析は1001 TP3T、RNA-seq解析は861 TP3Tに達しました。これらの結果は、特別に設計された研究エージェントフレームワークが、生物学的データ解析における汎用大規模モデルの実用性を大幅に向上させることができることを示していますが、複雑な多段階バイオインフォマティクスタスクにおいては、さらなる最適化の余地が残されています。
Robinは効率とコストの面でも明確な優位性を示しています。調査統計によると、システムを使用した完全な調査ワークフロー1件あたりの平均コストは約10.76ドルです。一方、ロビンは551件の文書の統合分析を30分以内に完了することができた。同じ量の作業を手作業で行う場合、通常は800時間以上かかります。システム全体では、調査プロセスの1ラウンドを2時間以内に完了するため、従来の手作業による調査プロセスよりも約200倍効率的です。
最後に書きます
Robinの意義は、複数の有望な薬剤候補の発見にとどまらない。より重要なのは、人工知能が生命科学分野において「補助ツール」から「半自律型研究システム」へと進化する可能性を初めて実証した点にある。もちろん、こうしたシステムは真の意味での「自律型科学者」には程遠い。複雑な実験設計、様々なスケールにおける生物学的メカニズムの理解、結果の解釈可能性といった課題は、依然として専門家の関与に大きく依存している。しかし、Robinの登場は少なくとも、AIがもはや研究者の「効率向上」を支援する単なるツールではなく、科学的発見そのものに参画する能力を徐々に獲得しつつあることを示している。








