La-Proteina: 부분적으로 잠재적인 흐름 일치를 통한 원자단위 단백질 생성

최근, de novo 단백질 구조 설계를 위한 많은 생성 모델이 등장했습니다. 그러나 이들 중 대부분은 아미노산 서열과 함께 완전한 원자 수준의 구조를 직접 생성하는 어려운 과제를 다루지 않습니다. 예를 들어, 모델이 생성 과정에서 길이가 변하는 측쇄(side chain)에 대해 추론해야 하기 때문에 이는 매우 도전적입니다. 우리는 새로운 부분적으로 잠재적인 단백질 표현을 기반으로 하는 원자 수준의 단백질 설계를 위한 La-Proteina를 소개합니다. 굵은 주사슬 구조는 명시적으로 모델링되며, 서열과 원자 수준의 세부 사항은 고정된 차원성을 가진 잔여물별 잠재 변수를 통해 포착됩니다. 이를 통해 명시적인 측쇄 표현의 문제들을 효과적으로 우회할 수 있습니다. 이 부분적으로 잠재적인 공간에서 흐름 일치(flow matching)는 서열과 전체 원자 구조 간의 결합 분포를 모델링합니다. La-Proteina는 상세한 구조 분석 및 평가를 통해 확인된 바와 같이, 모든 원자 co-설계 가능성, 다양성, 그리고 구조 유효성 등을 포함한 여러 생성 벤치마크에서 최고 성능을 달성하였습니다. 특히, La-Proteina는 원자 수준의 모티프 스캐폴딩 성능에서도 이전 모델들을 능가하여 중요한 원자 구조 조건부 단백질 설계 작업을 가능하게 합니다. 또한, La-Proteina는 대부분의 기준들이 무효화되고 유효한 샘플을 생성하지 못하는 800개 이상의 잔여물(residue)을 가진 co-설계 가능한 단백질까지 생성할 수 있으며, 이는 La-Proteina의 확장성과 안정성을 입증합니다.