Command Palette

Search for a command to run...

2ヶ月前

FusionProt:シーケンスと構造情報の統合による統一的タンパク質表現学習

Dan Kalifa Uriel Singer Kira Radinsky

FusionProt:シーケンスと構造情報の統合による統一的タンパク質表現学習

要約

タンパク質は生物系におけるさまざまな生体過程において中心的な役割を果たしており、生体システム内の複雑なメカニズムを理解する上で不可欠である。薬剤開発、合成生物学、疾患メカニズムの解明といった分野における進展には、タンパク質の正確な表現が不可欠である。現在の主流の手法は主に一次元(1D)構造、すなわちアミノ酸配列に注目しているが、これではタンパク質の機能性や相互作用を決定する重要な三次元(3D)構造情報が無視されてしまう。1Dと3Dの両モダリティを活用しようとする初期の試みは、単一モダリティの表現に比べて限定的な効果にとどまっている。本研究では、タンパク質の1D構造と3D構造を同時に統合的に表現する学習フレームワーク「FusionProt」を提案する。FusionProtは、タンパク質言語モデルとタンパク質の3D構造グラフとの間で情報の逐次的交換を可能にする、学習可能な融合トークン(fusion token)を採用している。このトークンは両モダリティの学習プロセスに統合されており、情報の滑らかな伝達を実現するとともに、反復的な学習サイクルを通じて包括的な表現を獲得する仕組みを提供する。多様な生物学的タスクにおける実証的評価により、FusionProtが最先端の性能を達成することが示され、タンパク質表現学習分野における顕著な進展を示している。

AI で AI を構築

アイデアからローンチまで — 無料の AI 共同コーディング、すぐに使える環境、最適価格の GPU で AI 開発を加速。

AI 共同コーディング
すぐに使える GPU
最適価格
今すぐ始める

Hyper Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています