Command Palette
Search for a command to run...
Natalia Flechas Manrique Alberto Martínez Elena López-Martínez Luc Andrea Román Orus et al

要約
エピトープは、抗体や免疫細胞受容体によって認識される短い抗原性ペプチド配列であり、免疫療法やワクチン、診断法の開発において中心的な役割を果たす。しかし、線形エピトープのnアミノ酸からなる配列の組み合わせは膨大な組み合わせ空間を形成するため、合成エピトープライブラリの合理的設計は困難であり、高スループット実験技術を用いてもスクリーニングや検証が現実的ではない。本研究では、タンパク質データに基づいて事前学習し、線形エピトープに特化して微調整された大規模言語モデル「epiGPTope」を提案する。本モデルは、初めて既知のエピトープと類似した統計的性質を持つ新しいエピトープ様配列を直接生成可能であることが明らかになった。この生成的手法を用いることで、エピトープ候補配列のライブラリを構築できる。さらに、統計的分類器を訓練し、エピトープ配列が細菌由来かウイルス由来かを予測する手法を構築することで、候補ライブラリを絞り込み、特定のエピトープを同定する確率を高める。本研究では、生成モデルと予測モデルを組み合わせたアプローチが、エピトープの発見において有効である可能性を提唱する。このアプローチは、エピトープの幾何学的構造や手作業による特徴量設計を必要とせず、線形エピトープの一次アミノ酸配列のみを用いる。生物学的に現実的な配列を生成するための手法を開発したことで、合成エピトープの設計およびスクリーニングをより迅速かつ低コストで実施できると期待される。本手法は、新規バイオテクノロジーの開発において重要な応用が期待される。