要約
動機抗体の結合部位を特定することは、ワクチンや治療用抗体の開発において極めて重要であるが、これらのプロセスは時間と費用を要する。抗体-抗原相互作用の理解を深めることで、パラトープ(抗原結合部位)の正確な予測が可能となり、開発プロセスの加速が期待できる。結果本研究では、表面の幾何学的特徴と非幾何学的要因を統合することで、パラトープ予測の精度を大幅に向上させる深層学習モデル「ParaSurf」を提案する。本モデルは、3つの代表的な抗体-抗原ベンチマークデータセット上で訓練および評価され、ほぼすべての評価指標において最先端の性能を達成した。従来のモデルが可変領域に限定されるのに対し、ParaSurfは抗体のFab領域全体にわたって正確な結合スコアを予測する能力を示した。さらに、使用された3つのデータセットの中で最も規模の大きなデータセットを用いて、以下の3つの重要な要素について包括的な解析を実施した:(1)補完性決定領域(CDR)ループごとのパラトープ予測の詳細評価、(2)重鎖のみを用いて訓練されたモデルの性能、(3)重鎖のデータを一切用いずに軽鎖のみで訓練されたモデルの結果。利用可能性と実装ParaSurfのソースコード、使用したデータセット、前処理パイプライン、および学習済みモデルの重みは、https://github.com/aggelos-michael-papadopoulos/ParaSurf にて無料で公開されている。補足情報補足データは、Bioinformaticsオンライン版にて提供されている。