17일 전
사이드체인 조건부 설정 및 모델링을 이용한 전체 원자 단백질 서열 설계에 대한 FAMPNN 연구
Talal Widatalla, Richard W. Shuai, Brian Hie, Possu Huang

초록
고정된 백본을 가진 단백질 서열 설계를 위한 주요 딥 러닝 기반 방법들은, 단백질의 구조, 안정성 및 전체 기능에 큰 영향을 미치는 사이드체인 원자의 3차원 배열을 서열 생성 과정에서 모델링하지 않습니다. 대신 이러한 모델들은 백본 기하학과 아미노산 서열만을 바탕으로 중요한 사이드체인 상호작용을 암시적으로 추론합니다. 이를 해결하기 위해, 우리는 FAMPNN (Full-Atom MPNN)을 제시합니다. 이는 각 잔기의 서열 특성과 사이드체인 구조를 명시적으로 모델링하는 서열 설계 방법입니다. 각 토큰의 이산적인 아미노산 특성 분포와 연속적인 사이드체인 구조 분포는 범주적 크로스 엔트로피와 확산 손실 목표를 결합하여 학습됩니다. 우리는 이러한 분포를 공동으로 학습하는 것이 시너지 효과가 매우 큰 작업이며, 서열 복구 성능을 개선하면서 최신 수준의 사이드체인 패킹을 달성함을 보여줍니다. 또한 명시적인 전자 원자 모델링의 이점은 서열 복구에서 실험적 결합 및 안정성 측정의 제로샷 예측과 같은 실제 단백질 설계 응용 프로그램으로 일반화됨을 입증하였습니다.