HyperAI초신경
Back to Headlines

중국 연구팀, 인공지능을 활용한 효율적 단백질 공학 방법 개발

9일 전

중국과학원이 개발한 인공지능 기반의 일반적인 단백질 공학 방법 단백질 공학은 단백질의 유연성을 활용하여 아미노산 순서를 인위적으로 변경하여 단백질 구조와 기능을 개선하고 변형하는 과학 분야이다. 이는 유전체 공학과 달리, 단백질 분자 자체를 직접 조작할 수 있어 단백질 기능의 최적화와 혁신을 빠르게 이루어낼 수 있다. 그러나, 현재까지의 단백질 공학 전략은 경험에 크게 의존하며, 실험 주기가 길고 비용이 많이 들기 때문에 대규모 적용에 제약이 있었다. 이상적인 단백질 공학 전략은 최소한의 투자로 최상의 공학 성능을 달성할 수 있어야 한다. 최근, 중국과학원 유전체 및 발달생물학 연구소 고채샤 연구팀은 구조적이고 진화적인 제약을 통합한 일반적인 역접힘 모델을 기반으로 새로운 인공지능 단백질 공학 계산 시뮬레이션 방법인 AiCE (AI-informed Constraints for Protein Engineering)를 개발했다. 이 방법은 특정 단백질에 대한 독립적인 AI 모델을 훈련시키지 않고도 단백질의 효율적인 진화 시뮬레이션과 기능 설계를 실현할 수 있다. 연구팀은 AiCE를 이용하여 다양한 유전자 편집 도구를 진화적으로 최적화하여 효율성과 정확성을 빠르게 향상시켰다. 역접힘은 AI 모델을 사용하여 주어진 3차원 구조로부터 호환 가능한 아미노산 순열을 예측하는 과정을 말한다. 일반적인 역접힘 모델은 천연 단백질 구조와 순서를 통해 단백질 골격의 기하학적 및 물리적 특성을 암묵적으로 학습하고, 진화 역학에 의해 형성된 단백질 순서의 복잡한 분포 패턴을 포착한다. 연구팀은 기존의 일반적인 역접힘 모델을 기반으로 AiCEsingle 모듈을 개발했다. 이 모듈은 주어진 단백질 3차원 구조에서 역접힘 모델의 출력 아미노산 순열을 샘플링하여 자주 등장하는 아미노산 유형을 추천하고, 더 나아가 구조적 제약을 통해 아미노산 빈도를 차별화하여 최종적으로 단일 아미노산 치환 유형을 예측한다. 연구팀은 60개의 깊은 돌연변이 스캔 데이터를 사용하여 AiCEsingle의 성능을 테스트했으며, 16%의 예측 정확도를 달성했다. 제거 실험과 로지스틱 회귀 분석을 통해 구조적 제약의 필요성을 입증했으며, 제약 없이 진행된 방안보다 성능이 37% 향상되었다. 또한, 병렬 비교 분석 결과, AiCEsingle은 다른 일반적인 AI 모델들보다 36%에서 90% 이상의 성능 향상을 보였다. 단백질 유형별로 보면, AiCEsingle은 CRISPR 단백질, SARS-CoV-2 바이러스 단백질 등 복잡한 단백질과 단백질-나ucleic acid 복합체의 효과적인 진화를 실현했으며, 광범위한 일반성을 가졌다. 연구팀은 또한 여러 돌연변이 조합에서 널리 존재하는 부정적인 상위효과를 극복하기 위해, 진화 쿠플링이 있는 아미노산 위치에서 기능적 협동이 가능하다는 가설을 세웠다. 이를 기반으로, 진화 쿠플링을 예측하여 돌연변이 조합 위치를 예측하는 AiCEmulti 모듈을 개발했다. 6개의 돌연변이 라이브러리를 분석한 결과, AiCEmulti는 대형 단백질 모델 SaProt와 비슷한 예측 능력을 보였지만, 계산 비용은 훨씬 적었다. 고채샤 연구팀이 개발한 AiCE 방법은 단일 돌연변이와 조합 돌연변이를 빠르고 효과적으로 예측할 수 있으며, 기존의 일반적인 역접힘 모델을 활용하여 특정 단백질 모델을 다시 또는 이전 훈련할 필요가 없어, 계산 비용을 크게 줄였다. SpCas9 단백질의 단일 돌연변이와 이중 돌연변이를 식별하는 데 단 1.15 CPU 시간이 필요했다. 더 나아가, 연구팀은 이 방법을 통해 실험실 환경에서 다양한 구조와 기능을 가진 8개의 단백질, 즉 탈아민화효소, 핵 국부화 서열, 핵산분해효소, 역전사효소 등에 대해 AiCE 기능을 검증했다. 이는 그들의 방법이 간단하면서도 효율적이고 일반적임을 입증했다. 특히, 최적화된 탈아민화효소를 활용하여, 정밀 의료와 분자 육종에 사용할 수 있는 새로운 염기 편집기를 개발했다. 이에는 편집 창이 거의 절반 수준으로 축소된 새로운 시토신 염기 편집기 enABE8e, 충실성이 1.3배 향상된 새로운 아데닌 염기 편집기 enSdd6-CBE, 활성이 13배 향상된 새로운 미토콘드리아 염기 편집기 enDdd1-DdCBE 등이 포함된다. 연구 결과, AiCE는 전통적인 단백질 공학 방안과 비교하여 효율성, 확장성, 그리고 일반성 면에서 모두 우수한 성능을 보였으며, 7월 7일에 이러한 연구 성과는 '셀' (Cell) 저널에 '구조적 및 진화적 제약을 통합한 역접힘 모델을 활용하여 단백질 진화를 발전시키다'라는 제목으로 발표되었다. 이 연구는 농업농촌부, 국가자연과학기금, 국가중점개발계획 등의 지원을 받았다. AiCE 방법은 단백질 공학 분야에서 새로운 표준을 제시하며, 기존 모델 훈련 과정의 복잡성과 비용을 크게 줄여주는 혁신적인 접근 방식으로 평가받고 있다. 연구팀의 성과는 단백질 공학의 미래에 큰 영향을 미칠 것으로 기대되며, 다양한 생명 과학 연구 및 응용 분야에서 활용될 가능성이 높다.

Related Links