구글 딥마인드, AI로 유전체 이해한 알파게놈 출시
Google DeepMind이 최근 새로운 인공지능(AI) 도구인 AlphaGenome을 소개하며, 이는 인간 DNA 시퀀스의 단일 변이 또는 돌연변이가 다양한 생물학적 과정에 미치는 영향을 더 정확하고 포괄적으로 예측할 수 있는 모델이다. AlphaGenome은 최대 100만 개의 DNA 문자(베이스 쌍)를 입력으로 받아, 각 문자 단위에서 고해상도로 예측을 제공한다. 이 모델은 ENCODE, GTEx, 4D Nucleome, FANTOM5 등의 공공 컨소시엄이 실험적으로 측정한 데이터를 기반으로 학습되었다. AlphaGenome의 주요 특징 장기 시퀀스 컨텍스트 및 고해상도 예측: AlphaGenome은 최대 100만 베이스 쌍의 DNA 시퀀스를 분석하고, 각 베이스 쌍 단위에서 예측을 한다. 이는 유전자를 멀리 떨어져 있는 지역에서 조절하는 요소와 세부적인 생물학적 정보를 포착하기 위해 중요하다. 이전 모델들은 시퀀스 길이와 해상도 사이에서 선택을 해야 하는 문제가 있었으나, AlphaGenome은 이러한 제한을 해결하면서 학습 리소스를 크게 늘리지 않았다. 포괄적인 다중모달 예측: AlphaGenome은 다양한 예측 모달리티를 처리할 수 있어, 유전자 발현, RNA 스피싱, 크로마틴 접근성, 트랜스크립션 인자 결합 등을 포함한 복잡한 유전자 조절 과정에 대한 정보를 제공한다. 효율적인 변이 스코어링: AlphaGenome은 변이의 영향을 효율적으로 평가할 수 있다. 이는 변이 시퀀스와 비변이 시퀀스의 예측 결과를 대조하여 수행되며, 다양한 모달리티에 대해 적절한 접근법을 사용하여 요약한다. 새로운 스피싱 접속점 모델링: AlphaGenome은 RNA 스피싱 오류를 유발하는 변이를 처음으로 명시적으로 모델링할 수 있다. 스피싱 오류는 일부 희귀 유전병, 예를 들어 척수성 근위축증(SMA)과 일부 낭포성 섬유증(CF)의 원인이 될 수 있으며, AlphaGenome은 이러한 변이가 스피싱 패턴에 미치는 영향을 깊이 있게 이해할 수 있도록 돕는다. 성능과 벤치마크 AlphaGenome은 24개의 게놈 트랙 예측 및 26개의 변이 효과 예측 작업에서 전문 모델들과 일반 모델들을 대상으로 엄격히 벤치마킹되었다. 이 모델은 22/24, 24/26의 평가에서 최고 성능을 보였으며, 특히 스피싱, 유전자 발현, 크로마틴 관련 작업에서는 SpliceAI, Borzoi, ChromBPNet 등과 비교해 우수한 성능을 나타냈다. 예시: AlphaGenome은 DLG1 유전자에서 관찰된 4bp 삭제 변이의 임상적으로 확인된 스피싱 중단을 정확히 모델링했다. 또한 T-ALL(임파구 백혈병)과 관련된 TAL1 온코جين 상류의 비코딩 변이 분석에서도, 알려진 에피게놈 변화와 발현 증가 메커니즘을 재현함으로써 그 능력을 입증했다. 연구 활용 AlphaGenome은 다음과 같은 연구 방향에서 중요한 도구가 될 수 있다: 질병 이해: AlphaGenome은 유전적 변이의 기능적 영향을 더 정확히 예측함으로써, 질병의 잠재적 원인을 더 정밀하게 특정할 수 있다. 특히 희귀 유전자 변이를 연구하는 데 적합하다. 합성 생물학: 이 모델의 예측은 특정 조절 기능을 가진 합성 DNA 설계를 안내하는 데 사용될 수 있다. 예를 들어, 신경세포에서만 유전자를 활성화시키되 근육세포에서는 그렇지 않도록 할 수 있다. 기초 연구: AlphaGenome은 게놈의 핵심 기능 요소를 매핑하고, 그 역할을 정의하여, 특정 세포 유형의 기능에 필수적인 DNA 지시사항을 식별하는 데 도움을 줄 수 있다. 현재의 한계 AlphaGenome은 큰 진보를 가져왔지만, 여전히 개선해야 할 부분이 있다. 매우 먼 거리의 조절 요소(100,000 베이스 쌍 이상)를 정확히 포착하는 것이 어려운 문제이며, 세포 및 조직 특이적인 패턴을 더 많이 포착하는 것이 미래의 우선 과제다. 또한, 개인 게놈 예측을 위한 디자인이나 검증은 아직 이루어지지 않았다. 복잡한 특성이나 질병에 대한 전체적인 영향을 예측하는 데는 개발적 및 환경적 요인 등 더 넓은 생물학적 과정이 필요하다. 커뮤니티 참여 AlphaGenome은 비상업적 연구용으로 API를 통해 미리 보기 버전으로 제공되고 있다. 연구자들은 AlphaGenome API를 통해 다양한 사용 사례를 탐색하고, 질문하거나 피드백을 공유할 수 있다. DeepMind은 학계, 업계, 정부 조직의 외부 전문가들과 협력하여 AlphaGenome이 가능한 많은 사람들에게 혜택을 줄 수 있도록 노력하고 있다. AlphaGenome은 게놈의 복잡한 세포 과정을 이해하고, 변이의 영향을 평가하는 데 있어 중요한 도구가 될 것으로 기대된다. 이를 통해 게놈학과 건강케어 분야에서 흥미로운 새로운 발견들이 이루어질 것으로 전망된다. 전문가 및 산업 댓글 Dr. Caleb Lareau (Memorial Sloan Kettering Cancer Center)는 "이 모델은 장거리 컨텍스트, 베이스 수준의 정밀도, 그리고 광범위한 게놈 작업에서 최고 성능을 모두 통합한 최초의 모델"이라고 말하며, AlphaGenome의 중요성을 강조했다. Professor Marc Mansour (University College London)는 "비코딩 변이의 관련성을 결정하는 것은 특히 대규모로 수행하기 어려운 도전이었는데, 이 도구는 질병 understanding을 향상시키는 중요한 퍼즐 조각이 될 것"이라고 덧붙였다. AlphaGenome은 게놈학 연구에 혁신을 가져올 뿐만 아니라, 희귀 유전병과 암 등의 질병 이해에서 중요한 역할을 할 것으로 기대된다.