3달 전
딥러닝 기반 단일 영역 및 다중 영역 단백질 구조 예측에 대한 D-I-TASSER 연구
Wei Zheng, Qiqige Wuyun, Yang Li, Lydia Freddolino, Yang Zhang

초록
깊은 학습 기술이 단백질 구조 예측에서 주도적인 성공을 거두면서, 전통적인 힘장 기반 폴딩 시뮬레이션의 필요성과 유용성이 도전받고 있습니다. 우리는 다중 소스의 깊은 학습 잠재력을 반복적 스레딩 조각 조립 시뮬레이션과 통합하여 원자 수준의 단백질 구조 모델을 생성하는 하이브리드 접근 방식인 깊은 학습 기반 반복적 스레딩 조립 정제(D-I-TASSER)를 제안하였습니다. D-I-TASSER는 대형 다영역 단백질 구조의 자동 모델링을 위해 영역 분할 및 조립 프로토콜을 도입합니다. 벤치마크 테스트와 가장 최근의 단백질 구조 예측 중요 평가 실험 15건은 D-I-TASSER가 단일 영역 및 다영역 단백질 모두에서 AlphaFold2와 AlphaFold3보다 우수한 성능을 보임을 입증하였습니다. 대규모 폴딩 실험에서는 D-I-TASSER가 인간 프로테오미에서 81%의 단백질 영역과 73%의 전체 체인 서열을 AlphaFold2가 최근에 발표한 모델과 높은 상보성을 가진 결과로 접힘(folding)할 수 있음을 보여주었습니다. 이러한 결과들은 깊은 학습과 고전적인 물리학 기반 폴딩 시뮬레이션을 통합하여 유전체 규모 응용 프로그램에서 사용 가능한 고정밀 단백질 구조 및 기능 예측을 수행할 수 있는 새로운 방향성을 제시하고 있습니다.