11日前

SSM-DTA:薬物-標的親和性予測におけるデータ不足の壁を破る

Qizhi Pei, Lijun Wu, Jinhua Zhu, Yingce Xia, Shufang Xie, Tao Qin, Haiguang Liu, Tie-Yan Liu, Rui Yan
SSM-DTA:薬物-標的親和性予測におけるデータ不足の壁を破る
要約

ドラッグ-ターゲット親和性(DTA)の正確な予測は、創薬の初期段階において極めて重要であり、特定のターゲットと効果的に相互作用し、その機能を調節できる薬剤の同定を促進する。現時点では、実験室における湿式実験(wet experiments)が最も信頼性の高い手法であるが、時間とリソースを大量に要するため、データの可用性が限られており、これにより深層学習アプローチの発展に課題が生じている。従来の手法は、既存のDTAデータに基づく技術開発に主眼を置いており、データ不足という根本的な問題に対して十分な対策を講じていない。この課題を克服するために、本研究では、三つの簡潔かつ高効果な戦略を統合した「SSM-DTAフレームワーク」を提案する。第一に、ペアドされたドラッグ-ターゲットデータを用いてDTA予測とマスク言語モデル(MLM)を同時に行うマルチタスク学習アプローチを採用する。第二に、大規模なペアされていない分子およびタンパク質データを活用して、半教師あり学習による分子およびターゲット表現の強化を実現する。これは、従来の手法が事前学習段階で分子またはタンパク質のいずれか一方のみを用いたのに対し、両方を統合的に活用する点で異なる。第三に、軽量なクロスアテンションモジュールを導入し、ドラッグとターゲット間の相互作用を強化することで、予測精度をさらに向上させる。本研究では、BindingDB、DAVIS、KIBAといったベンチマークデータセットを用いた広範な実験により、本フレームワークの優れた性能を実証した。さらに、特定のドラッグ-ターゲット結合活性に関するケーススタディ、仮想スクリーニング実験、ドラッグ特徴の可視化、および実世界応用の検証を通じて、本研究の大きな潜在能力を示した。結論として、本研究で提案するSSM-DTAフレームワークは、DTA予測におけるデータ制約問題に対処し、有望な成果を上げることで、より効率的かつ正確な創薬プロセスの実現に貢献するものである。本研究のコードは、$\href{https://github.com/QizhiPei/SSM-DTA}{Github}$にて公開されている。

SSM-DTA:薬物-標的親和性予測におけるデータ不足の壁を破る | 最新論文 | HyperAI超神経