18日前
AMix-1:テスト時スケーラブルなタンパク質フォンドエーションモデルへの道
Changze Lv, Jiang Zhou, Siyu Long, Lihao Wang, Jiangtao Feng, Dongyu Xue, et al

要約
我々は、ベイズ型フローネットワーク(Bayesian Flow Networks)を基盤とし、事前学習のスケーリング則、顕在能力の分析、コンテキスト内学習メカニズム、テスト時スケーリングアルゴリズムを統合した体系的な学習手法により強化された、強力なタンパク質基盤モデル「AMix-1」を紹介する。堅牢なスケーラビリティを確保するため、予測可能なスケーリング則を構築し、損失関数の観点から構造的理解の段階的発現を明らかにした結果、17億パラメータ規模の強力なモデルが得られた。この基盤の上に、複数配列アラインメント(MSA)に基づくコンテキスト内学習戦略を設計し、タンパク質設計を包括的なフレームワークに統合した。このフレームワークにより、AMix-1はMSA間の深い進化的信号を認識し、構造的・機能的に整合性の高いタンパク質を一貫して生成できるようになった。このアプローチにより、野生型と比較して最大50倍の活性向上を達成した大幅に改善されたAmeR変異体の設計に成功した。タンパク質工学の限界をさらに押し広げるため、AMix-1に進化的なテスト時スケーリングアルゴリズムを導入し、シミュレーション上での指向的進化(in silico directed evolution)を実現。検証予算を増大させることで、顕著かつスケーラブルな性能向上を達成し、次世代の「ラボ・イン・ザ・ループ」型タンパク質設計の基盤を築いた。