DeepMindAIが87種の新解析法を自動生成、遺伝子研究で人間最強を上回る成果
グーグルのDeepMindが、MITとハーバード大学と共同で発表した画期的研究により、AIが科学実験用ソフトウェアを自動生成する新たなアプローチが実証された。このシステムは、大規模言語モデル(LLM)と木探索(tree search)を組み合わせ、数時間から数日間で、従来数か月を要する研究開発を自動で実行。論文はarXivに掲載され、71ページにわたり詳細な実験と分析を含む。 研究の焦点は「可評価課題」(scorable tasks)と呼ばれる、特定の評価指標を最大化するための「実証ソフトウェア」の自動生成にある。このAIシステムは、ユーザーが提示する問題定義、評価基準、データをもとに、最初にLLMが候補コードを生成。その後、樹探索アルゴリズム(PUCT)が、各コードの実行結果(スコア)をもとに、どの解を改良・拡張すべきかを戦略的に選択。このプロセスを繰り返すことで、段階的に高精度なソフトウェアが進化する。 特に注目すべきは、Kaggleの16大会で実験した結果。AIは「単一LLM呼び出し」や「1000回のLLM実行」を上回る性能を発揮。特に「樹探索+専門的ヒント」の組み合わせでは、トップ84%の参加者を上回る成績を記録。これは、AIが外部の研究知識(論文、教材、Gemini Deep Researchなど)を統合し、新たな戦略を発見できることを示している。 生物学分野では、単細胞RNAシーケンス(scRNA-seq)のバッチ効果除去という難題に挑戦。AIは87種類の新規解析手法を提案し、そのうち40種がOpenProblemsのランキングで人類最良手法を上回った。特に「BBKNN(TS)」という手法は、既存のComBatとBBKNNを再構成し、既存最良手法より14%高い精度を達成。 また、斑馬魚の全脳神経活動予測(ZAPBench)でも、AIはUnetベースの最良モデルを上回る性能を発揮。時間的依存性や神経細胞の特徴を統合したモデルを自動設計。さらに、生物物理学的シミュレーションライブラリ「Jaxley」を組み込む試みも成功し、モデルの解釈可能性と科学的根拠の強化を示した。 この成果は、AIが単なるコード生成ツールではなく、科学的知見を統合し、新たな理論や手法を創出する「AI共同研究者」としての可能性を示している。DeepMindの研究チームは、AIが科学の進歩を加速する「普遍的基盤」としての役割を確立しつつある。
