11日前

知識設計:知識の精錬によるタンパク質設計の限界への挑戦

Zhangyang Gao, Cheng Tan, Stan Z. Li
知識設計:知識の精錬によるタンパク質設計の限界への挑戦
要約

最近の研究では、目的の構造に折りたたまれるアミノ酸配列を設計するタンパク質設計において、競争力のある性能が示されている。しかし、これらの多くは予測信頼度の重要性を無視しており、広大なタンパク質空間をカバーできていない上、一般的なタンパク質の知識も統合されていない。多様なタンパク質関連タスクにおいて事前学習モデルが著しい成功を収めたこと、および回復率(recovery rate)が信頼度と強く相関しているという事実に着目し、この知識を活用することでタンパク質設計の限界をさらに押し広げられるかどうかを検討した。その解決策として、低品質なアミノ酸残基を精緻化する「知識を意識したモジュール」を提案する。また、学習時間の50%以上を削減できるメモリリトリーバ機構を導入した。本手法はCATH、TS50、TS500の各データセットにおいて広範な評価を実施し、その結果、従来のPiFold手法と比較してCATHデータセット上で約9%の性能向上を達成した。特に、Knowledge-DesignはCATH、TS50、TS500の各ベンチマークで60%以上の回復率を初めて達成した最初の手法である。さらに、提案手法の有効性を裏付ける追加分析も提供している。コードは公開予定である。

知識設計:知識の精錬によるタンパク質設計の限界への挑戦 | 最新論文 | HyperAI超神経