AIが生命の仕組みを解読へ Tahoe Bioが30億パラメータの遺伝子・細胞・薬剤連携モデル「Tahoe-x1」を公開
米国的生命科学企業Tahoe Bio(旧称:Vevo Therapeutics)は、がん研究の新たな地平を開くAI基礎モデル「Tahoe-x1(Tx1)」を正式発表した。このモデルは30億パラメータを有し、遺伝子・細胞・薬剤の複雑な相互作用を解読するための専用設計で、AIが「補助ツール」から「生命システムのモデリングエンジン」へと進化した象徴的な一歩となる。 Tahoe-x1はTransformerエンコーダーを基盤とし、マスク言語モデル(MLM)で学習。2.66億の単細胞転写組み合わせデータを用いて訓練され、同社が独自に構築した「Tahoe-100M」擾乱データセット(数千種の分子ががん細胞系に与える影響を記録)を含む。モデルはFlashAttention v2などの最適化技術を活用し、同クラスの細胞モデルと比較して3~30倍の計算効率を実現。一般のGPUでも高速に動作可能で、研究のアクセス障壁を大幅に低減している。 主な性能のうち、がんの「生存維持遺伝子」を予測する能力は、業界標準データセットDepMapにおいて既存モデルを上回り、異質性の高い難治性がんのターゲット発見を飛躍的に加速する。さらに、癌変に関与するシグナル経路の連携を自動解析でき、MSigDBデータベースでの「がんの標識プログラム」再構成精度はトップクラス。これにより、複数のターゲットを同時に狙う治療戦略の設計が可能になる。 特に注目すべきは、ゼロショット推論(zero-shot generalization)能力。未経験の細胞タイプや患者サンプルに対しても、既存知識に基づいて薬剤反応を予測できる。これにより、コンピュータ上で数万通りの治療法を仮想臨床試験し、候補を絞り込むことが可能となり、実験や臨床試験の失敗リスクを大幅に削減できる。 Tahoe Bioは、モデルの重み(Hugging Face)とコード(GitHub)をオープンソース化し、インタラクティブなデモとプレプリント(bioRxiv)も公開。累計資金調達4200万ドルを背景に、10億データポイント規模の世界最大級単細胞擾乱マップの構築を進めている。 AIbaseは、Tahoe-x1の真の価値が「統計的相関」から「生物学的メカニズムの理解」へと移行した点にあると評価。将来的には、患者一人ひとりに最適な治療法を仮想空間で探索するインフラとして、精密医療の基盤となる可能性を秘めている。
