18일 전
AMix-1: 테스트 시각 확장 가능한 단백질 기반 모델을 위한 길
Changze Lv, Jiang Zhou, Siyu Long, Lihao Wang, Jiangtao Feng, Dongyu Xue, et al

초록
우리는 베이지안 플로우 네트워크(Bayesian Flow Networks)를 기반으로 구축하고 체계적인 학습 방법론으로 강화된 강력한 단백질 기초 모델인 AMix-1을 소개한다. 이 모델은 사전 학습 확장 법칙, 잠재적 능력 분석, 컨텍스트 내 학습 메커니즘, 테스트 시 확장 알고리즘을 포함한 다각적인 학습 전략을 바탕으로 설계되었다. 강력한 확장성을 보장하기 위해 예측 가능한 확장 법칙을 수립하고, 손실 관점에서 구조적 이해의 점진적 발현을 규명함으로써, 최종적으로 17억 파라미터 규모의 강력한 모델을 구현하였다. 이 기반 위에서, 다중 서열 정렬(MSA) 기반의 컨텍스트 내 학습 전략을 개발하여 단백질 설계를 통합적 프레임워크로 통합하였으며, AMix-1은 MSA 내에서 깊은 진화적 신호를 인식하고 구조적·기능적으로 일관된 단백질을 지속적으로 생성할 수 있다. 본 프레임워크를 통해 야생형 대비 최대 50배의 활성 증가를 보이는 개선된 AmeR 변이체를 성공적으로 설계하였다. 단백질 공학의 경계를 확장하기 위해, AMix-1에 진화 기반 테스트 시 확장 알고리즘을 도입하여, 가상 환경에서의 유도 진화를 실현하였으며, 검증 예산이 증가함에 따라 상당한 확장 가능한 성능 향상을 달성하였다. 이는 차세대 ‘랩-인-더-루프(Lab-in-the-loop)’ 단백질 설계의 기반을 마련하는 중요한 성과이다.