Command Palette
Search for a command to run...
Natalia Flechas Manrique Alberto Martínez Elena López-Martínez Luc Andrea Román Orus et al

초록
에피토프는 항체나 면역세포 수용체에 의해 인식되는 단백질 항원의 짧은 펩타이드 서열을 의미한다. 이러한 에피토프는 면역요법, 백신, 진단법 개발에 핵심적인 역할을 한다. 그러나 선형 에피토프의 경우 n개 아미노산으로 구성된 서열의 조합이 매우 방대하여, 합성 에피토프 라이브러리의 합리적 설계가 어렵고, 고속 실험 기술을 사용하더라도 스크리닝과 검증이 현실적으로 불가능한 상황이다. 본 연구에서는 단백질 데이터로 사전 훈련된 대규모 언어 모델인 epiGPTope를 제안하며, 이 모델은 선형 에피토프에 대해 특별히 미세조정되어, 기존에 알려진 에피토프와 유사한 통계적 특성을 갖는 새로운 에피토프 유사 서열을 직접 생성할 수 있다. 이러한 생성 기반 접근법을 통해 에피토프 후보 서열의 라이브러리를 준비할 수 있다. 또한, 우리는 박테리아 또는 바이러스 기원의 에피토프 서열을 예측할 수 있는 통계적 분류 모델을 추가로 훈련하여 후보 라이브러리를 좁히고, 특정 에피토프를 발견할 확률을 높였다. 본 연구에서는 생성형 모델과 예측 모델의 조합이 에피토프 탐색에 유용할 수 있다고 제안한다. 본 방법은 선형 에피토프의 1차 아미노산 서열만을 사용하며, 기하학적 구조 프레임워크나 수작업으로 설계한 특징을 필요로 하지 않는다. 생물학적으로 타당한 서열을 생성할 수 있는 방법을 개발함으로써, 합성 에피토프의 설계 및 스크리닝이 더욱 빠르고 비용 효율적으로 이루어질 수 있을 것으로 기대되며, 이는 새로운 바이오테크놀로지 개발에 중요한 응용 가능성을 지닌다.