HyperAI초신경

Nature 저널에 게재되었습니다! 캘리포니아 대학교는 AI를 사용하여 극저온 전자 현미경 3D 재구성을 혁신하고 구조 생물학에서 큰 혁신을 달성했습니다.

特色图像

과학 연구 분야에서는 특정 기술이 획기적인 발전을 이루어 시대의 주목을 받는 경우가 많습니다. 2017년 노벨 화학상을 수상한 극저온 전자 현미경(Cryo-EM)이 그러한 기술 중 하나입니다. 예를 들어, 시이공(Shi Yigong)의 연구팀은 극저온 전자 현미경 기술을 이용해 2015년에 처음으로 스플라이소좀의 고해상도 구조를 밝혀냈습니다. 이는 지난 30년 동안 기초 생명 과학 분야에서 중국이 세계 과학에 이룬 가장 큰 공헌으로 찬사를 받았으며, 극저온 전자 현미경에 대한 광범위한 관심을 불러일으켰습니다.

구조 생물학 분야의 중요한 도구인 극저온 전자 현미경은 샘플을 빠르게 낮은 온도로 냉각시켜 샘플 내의 물 분자가 결정화되는 것을 방지하고, 이를 통해 샘플의 생리학적 상태에 가까운 상태를 보존합니다.샘플이 동결되면 연구자들은 다양한 해상도(원자 수준의 해상도 포함)에서 3D로 샘플을 시각화하기 위해 다양한 극저온 전자현미경(Cryo-EM) 기술을 사용하여 샘플에 대한 더 깊고 포괄적인 이해를 얻을 수 있습니다.

그러나 극저온 전자 현미경 기술이 점점 더 발전함에도 불구하고, 시료 준비 중 방향 이점 문제는 항상 어려운 문제였습니다. 일반적으로 3D 재구성 과정에는 전체 공간을 덮기 위해 모든 방향에서 단백질을 투영해야 합니다. 그러나 공기-액체 계면(AWI)에 흡착된 단백질은 종종 방향성 이점을 나타내어 불완전한 투영 데이터 세트를 초래하고, 이는 다시 단백질 밀도의 다양한 정도의 왜곡을 초래하여 재구성 왜곡으로 이어집니다.

최근에,UCLA 연구팀은 단일 입자 IsoNet(spIsoNet)이라는 자기 감독 딥 러닝 방법을 제안했습니다.이 방법은 샘플의 등방성을 회복하는 새로운 방법을 제공합니다. spIsoNet을 단일 입자 극저온 전자현미경에 적용하면 생물학적 거대 분자의 재구성 품질을 크게 개선하고, 정렬 정확도와 각도 등방성을 향상시키며, 구조 생물학 분야에 새로운 혁신을 가져올 수 있습니다.

"자기 감독 딥 러닝을 통해 크라이오-EM의 선호 방향 문제 극복"이라는 제목의 연구는 국제 학술지인 Nature Methods에 게재되었습니다.

연구 하이라이트:
* 본 연구에서는 크라이오-EM의 영상 품질을 개선하는 데 활용 가능한 자기감독 딥러닝(Self-Supervised Deep Learning, spIsoNet) 기반의 엔드투엔드(End-to-End) 방법을 개발했다.

* spIsoNet은 선호도 방향 문제로 인해 발생하는 3D 재구성 문제를 해결할 수 있습니다.
* spIsoNet은 3D 재구성 중 각도 등방성 및 입자 정렬 정확도를 향상시킵니다.


서류 주소:
https://doi.org/10.1038/s41592-024-02505-1

spIsoNet 데이터 세트 주소:
https://go.hyper.ai/P7XQu

오픈소스 프로젝트인 "awesome-ai4s"는 100개가 넘는 AI4S 논문 해석을 모아 방대한 데이터 세트와 도구를 제공합니다.

https://github.com/hyperai/awesome-ai4s

데이터 세트: 각각 다른 특성과 응용 프로그램 시나리오를 갖춘 여러 데이터 세트를 선택합니다.

이 연구에서 연구진은 spIsoNet의 성능을 테스트하기 위해 각각 고유한 특성과 응용 프로그램 시나리오를 갖춘 여러 데이터 세트를 사용했습니다.

β-갈락토시다아제 데이터 세트:여기에는 특정 방향을 갖는 두 개의 하위 집합, 즉 1,513개의 측면 보기 입자와 950개의 상단 보기 입자가 포함되어 있으며, 이는 spIsoNet이 기본 방향의 영향을 받는 이미지 품질(맵 품질)을 개선할 수 있는지 확인하는 데 사용됩니다.

HA 삼중체 기울어진 데이터 세트(EMPIAR-10097):이는 그리드 틸팅 전략을 통해 얻어지며, 이는 기울어진 시야 방향을 제공하고 spIsoNet이 기울어진 샘플을 처리하는 능력을 평가하는 데 사용할 수 있습니다.

비편향 HA 삼중체 데이터 세트(EMPIAR-10096):격자 없는 기울기 조건에서 수집하였고, 130,000개의 입자를 가져와서 정렬 오류를 보정한 결과, 3.45Å의 해상도를 가진 이미지가 생성되었습니다. 이는 기울어진 샘플과 기울어지지 않은 샘플 간의 처리 효과의 차이를 비교하는 데 사용할 수 있습니다.

비대칭 리보솜 데이터 세트(EMPIAR-10406):여기에는 아미카신과 복합된 A. baumannii 병원균의 70S 리보솜이 포함되어 있으며 복잡한 생물 분자 구조를 처리하는 spIsoNet의 성능을 평가하는 데 사용되었습니다.

HIV VLP 단층촬영 데이터 세트(EMPIAR-10164):여기에는 3.6Å의 분해능으로 미성숙 HIV-1 dMACANC 바이러스 유사 입자(VLP)가 포함되어 있습니다. 이 연구에서는 바이러스 입자의 구조에 대해 심층적으로 살펴보았습니다.

spIsoNet: U-net 딥러닝 모델을 기반으로 하며, 두 가지 주요 모듈로 구성됩니다.

spIsoNet에서 사용하는 신경망은 U-net 네트워크 아키텍처를 기반으로 합니다.이는 생물학적 이미지 복원 및 분할 분야에서 널리 인정을 받은 딥 러닝 모델입니다. 아래 그림 b에서 볼 수 있듯이, U-net은 합성곱 블록을 쌓아서 인코더-디코더 아키텍처를 기반으로 구성됩니다.

spIsoNet에서 사용하는 U-net 신경망 아키텍처

U-net 모델을 기반으로 하는 spIsoNet은 주로 두 가지 모듈로 구성됩니다.

이방성 보정 모듈

연구진은 극저온 전자 현미경 이미지의 선명도를 개선하기 위해 이방성 보정 모듈을 설계했습니다.아래 그림 c에 표시된 것처럼, 이 모듈은 두 개의 하프맵, 3차원 푸리에 셸 상관(3DFSC) 볼륨 및 용매 마스크를 입력 데이터로 사용하고 3DFSC 알고리즘을 통합하여 일관성 손실, 등가 분산 손실, 잡음 대 잡음 일관성 손실 및 잡음 대 잡음 등가 분산 손실을 포함한 네 가지 유형의 손실 함수의 가중 합을 최소화하여 크라이오-EM 이미지의 품질을 개선합니다.

이방성 보정 알고리즘의 개략도

이방성 보정 기반 정렬 불량 보정 모듈

아래 그림 e에서 볼 수 있듯이 이 모듈은 맵 필터링, 이방성 보정, RELION 자동 세부 조정의 세 가지 주요 단계를 포함하는 워크플로를 통합합니다. 이방성 보정은 이방성 보정을 통해 크라이오-EM 이미지의 품질을 개선하는 것을 목표로 하는 전체 프로세스의 핵심입니다.
* 이방성 보정은 특정 알고리즘을 통해 물체의 물리적, 화학적 특성 차이를 서로 다른 방향으로 보정하여 등방성 효과를 얻는 것을 말합니다.

* 정렬 불량 보정 기술은 주로 영상 처리 과정에서 기하학적 왜곡으로 인해 발생하는 영상 정렬 불량 문제를 보정하는 데 사용됩니다.

정렬 불량 보정 알고리즘의 개략도

이방성 보정을 완료한 후, 연구진은 더욱 정확한 입자 방향 매개변수와 RELION을 통해 재구성된 두 개의 반쪽 이미지를 얻었습니다. 각 3D 정밀화 반복 작업 후, 이러한 절반 이미지는 백색화 및 FSC 가중치를 포함한 후처리 필터를 통해 처리되어 이미지 품질이 더욱 향상됩니다. 그런 다음 spIsoNet 이방성 보정 모듈은 필터링된 절반 이미지를 처리하고, 처리된 보정된 절반 이미지는 저역 통과 필터링을 거쳐 해상도와 일치하는 표준에 도달합니다. 필터링 및 보정된 두 개의 절반 이미지는 이후 방향 추정을 위한 참조로 사용됩니다.

연구 결과: spIsoNet은 크라이오-EM 이미지 품질을 크게 향상시킵니다.

이방성 보정이 효과적입니다

연구원들은 spIsoNet의 이방성 보정 모듈이 시뮬레이션된 데이터에서 누락된 정보를 효과적으로 복구할 수 있다는 것을 발견했습니다. 그러므로,이 연구에서는 먼저 β-갈락토시다아제를 포함하는 RELION 튜토리얼 데이터 세트에서 spIsoNet을 테스트했습니다.

아래 그림 jm에서 볼 수 있듯이, 연구진은 2D 클래스 평균에서 측면 보기 입자와 상단 보기 입자를 선택하여 선호하는 방향을 가진 두 개의 입자 하위 집합을 컴파일하고 표준 RELION 3D 재구성을 수행했습니다. 테스트 결과에 따르면, 이방성 보정 모듈만으로도 상단 시점이나 측면 시점의 지배적인 방향으로 인해 발생하는 3D 재구성 아티팩트를 효과적으로 줄일 수 있습니다.

β-galactosidase 이미지에 적용된 이방성 보정

* 여기서 jl은 다양한 각도에서 재구성된 2D 분류 지도를 나타내고, km은 다양한 각도에서 재구성된 3D 분류 지도를 나타냅니다.

이방성 보정 및 정렬 불량 보정 기술은 Cryo-EM 이미지 품질을 크게 향상시킵니다.

이전 연구에 따르면 HA 삼량체 기울어진 데이터 세트의 크라이오-EM 이미지 품질은 이상적이지 않은 것으로 나타났습니다. spIsoNet의 효과를 테스트하기 위해,이 연구에서는 먼저 하프맵에 대한 이방성 보정을 수행했습니다.결과에 따르면, 보정된 이미지의 품질이 상당히 개선되었고, 국소 해상도가 증가했으며, 노이즈가 감소했습니다. 아래 그림 ab에서 볼 수 있듯이, 보정된 이미지에서는 원래 이미지에서는 구별하기 어려웠던 측사슬 밀도가 선명하게 보입니다.

다양한 방법으로 재구성된 HA 삼량체의 Cryo-EM 이미지

* 왼쪽부터 오른쪽으로: 표준 RELION 개선, 이방성 보정, 이방성 보정으로 인한 정렬 불량 보정.

또한, 아래 그림 cf에서 보듯이, 편향 보정 후의 영상은 영상에서 모델로의 푸리에 쉘 상관관계를 개선하고, 3차원 푸리에 쉘 상관관계(3DFSC)는 구형에 가깝습니다(0.991). 원본 이미지와 비교했을 때, 보정 후 이미지는 더 큰 등방성 푸리에 쉘 점유 면적(FSO)을 보여줍니다.

정렬 오류 수정 후 HA 삼량체의 Cryo-EM 이미지

* 여기서, ce는 각각 RELION 정밀화와 spIsoNet 정렬 불량 보정에 사용된 3DFSC 슬라이스이고, df는 각각 RELION 정밀화와 spIsoNet 정렬 불량 보정 결과로부터 계산된 Bingham 검정의 FSO와 P 값입니다.

정렬 오류 수정을 통해 잘못 할당된 많은 방향을 성공적으로 식별하고 수정했습니다.

심각한 편향 방향 문제가 있는 단백질 데이터 세트의 경우 기울어지지 않은 HA 삼량체 데이터 세트(EMPIAR-10096)이 연구에서는 spIsoNet의 이방성 보정 기반 정렬 오류 보정 모듈을 사용하여 입자 데이터 세트를 처리했습니다.기울어진 데이터 세트에서 재구성된 HA 삼량체 이미지가 참조 모델로 사용되었습니다.

연구진은 아래 그림 b-f에 표시된 것처럼 정렬 오류를 수정한 후 올바른 모양의 이미지를 얻었고 등방성이 크게 향상되었습니다. 아래 그림 h에서 볼 수 있듯이, 반쪽 지도 FSC(3.5Å)와 모델-지도 FSC(3.6Å)에 의해 결정된 이미지 해상도는 일관됩니다.

비대칭 HA 삼중체 데이터 세트에 spIsoNet 적용


*a-대표적인 cryo-EM 현미경 사진, b-다양한 방법으로 재구성된 HA 삼량체의 cryo-EM 이미지, c-표준 RELION 정제에 사용된 3DFSC 슬라이스, d-FSO 및 표준 RELION 정제 결과를 기반으로 계산된 Bingham 검정의 P-값, e-spIsoNet 정렬 불량으로 보정된 3DFSC 슬라이스, f-FSO 및 spIsoNet 정렬 불량 보정 결과를 기반으로 계산된 Bingham 검정의 P-값, g-cryo-EM 이미지에서 선택된 아미노산 잔류물 및 글리칸의 대표적 밀도, h-HA 삼량체의 보정된 FSC 곡선, i,j-다양한 방향의 분포 결과 및 해당 cryoEF 점수

spIsoNet은 비대칭 입자 및 핵산 분자를 포함하는 입자의 정렬을 개선하는 데 탁월합니다.

아래 그림과 같이, 이방성 보정 후 영상 품질이 크게 향상되어 밀도 분포가 더욱 연속적이고, 국소 해상도가 더 높으며, 노이즈 간섭이 줄었습니다.연구 결과70S 또는 80S 리보솜의 국소적 하위 단층촬영 평균을 기준으로 사용하고 정렬을 위해 초기 분해능 15Å를 유지하면 모델 편향이 없는 고품질 이미지를 지속적으로 얻을 수 있으며 이방성의 영향을 효과적으로 완화할 수 있습니다.

리보솜 데이터 세트에 spIsoNet 적용

* a, b- 다양한 재구성 방법을 통해 재구성된 리보솜 이미지, c, d- 맞춤 원자 모델이 적용된 대표적 밀도 영역(노란색)

spIsoNet은 현장 구조 생물학에 적용할 수 있는 잠재력을 가지고 있습니다.

이 연구에서는 spIsoNet을 하위 단층촬영 평균화에 적용하는 것을 평가하기 위해 HIV-1 VLP 단층촬영 데이터 세트(EMPIAR-10164)를 예로 사용했습니다.

아래 그림 a에서 볼 수 있듯이, 이 연구에서는 RELION4의 표준 프로세스에서 서로 다른 기울기 각도의 5개 그룹의 하위 집합을 사용하여 3.7Å의 분해능을 가진 구조를 얻었습니다. 그런 다음, 연구진은 정렬 오류 보정을 적용하여 아래 그림 e에 표시된 것처럼 등방성 3.6Å 분해능 구조를 얻었습니다.

아래 그림 bh에서 볼 수 있듯이, 구조 분석을 통해 측사슬 밀도가 더욱 명확하게 드러났고 FSO 곡선에서 3DFSC 구형도가 더 높게 나타났으며, 이는 입자 방향 추정의 정확도를 개선하는 데 도움이 됩니다.

국소 단층 평균 지도에 spIsoNet 적용

* a- 표준 RELION에 따라 재구성된 HIV-1 국소 분해능 맵, b- 표준 RELION 정제에 사용된 3DFSC 슬라이스, c- 표준 RELION 정제 결과에 따라 계산된 Bingham 검정의 FSO 및 P 값, d- 크라이오-EM 이미지에서 선택된 아미노산 잔류물 및 글리칸의 대표 밀도, e- spIsoNet 이방성 보정 기술에 따라 재구성된 HIV-1 국소 분해능 맵, f- spIsoNet 이방성으로 보정된 3DFSC 슬라이스, g- spIsoNet 이방성 보정 결과에 따라 계산된 Bingham 검정의 FSO 및 P 값, h- 크라이오-EM 이미지에서 선택된 아미노산 잔류물 및 글리칸의 대표 밀도

AI+저온전자현미경, '강력한 결합'의 기술적 패러다임

지난 2년 동안 과학계에서는 "알파폴드가 구조 생물학을 끝낼까?"라는 논란의 여지가 있는 주제가 있었습니다. 물론 대답은 '아니요'입니다.

한편으로는,AlphaFold와 같은 구조 예측 모델을 위한 훈련 데이터는 X선 및 극저온 전자 현미경과 같은 기존 구조 분석 방법에서 나옵니다.반면에,극저온 전자 현미경은 단백질 역학을 분석하는 데 매우 효과적인데, 이는 현재 AlphaFold에서는 불가능합니다. 그렇다면 AlphaFold로 대표되는 AI 기술이 극저온 전자 현미경으로 대표되는 기존 방법을 지원할 수 있을까요? 이는 필수라고 할 수 있다.

예를 들어, 2022년 초부터베이징대학교의 마오유동 교수 팀은 AI + 극저온 전자현미경을 사용하여유도된 프로테아좀이 기질 분해 중간 상태에서 기질 억제 중간 상태로 일시적으로 전환되는 현상을 성공적으로 포착했습니다. 인공지능 4차원 재구성 기술을 적용해 시간 분해능 극저온 전자현미경의 분석 정확도를 높인 것은 세계 최초입니다. 연구팀은 주요 질병과 관련된 표적 단백질 복합체에 대한 원자 수준의 기능 동역학 관찰을 달성했습니다. 관련 결과는 "시간 분해능 극저온 전자현미경을 이용한 인간 프로테아좀의 USP14 조절 이성질성"이라는 제목으로 Nature에 게재되었습니다.

논문 링크:
https://doi.org/10.1038/s41586-022-04671-8

요전,ByteDance 연구팀의 연구원들은 CryoSTAR라는 새로운 방법을 제안했습니다.이것은 냉동 전자 현미경 실험 데이터에 단백질 원자 구조 모달 사전 확률을 적용하는 최초의 방법입니다. 이는 생물학적 거대 분자의 구조적 이질성을 밝히기 위해 원자 모델 정보를 구조적 정규화로 사용합니다. 이 기술은 다양한 수준에서 분자의 구조적 변화를 보여주기 위해 거친 입자 모델과 밀도 지도를 출력할 수 있어 동적 구조 분석에 있어서 극저온 전자 현미경의 적용 가능성을 크게 향상시킵니다. 관련 결과는 "CryoSTAR: Cryo-EM 이질적 재구성을 위한 구조적 사전 및 제약 조건 활용"이라는 제목으로 Nature Methods에 게재되었습니다.

논문 링크:
https://www.nature.com/articles/s41592-024-02486-1

AI와 극저온 전자 현미경의 결합이 구조 생물학의 새로운 장을 열고 있다는 점에는 의심의 여지가 없으며, 또한 AI 기술이 기존 구조 생물학 방법을 지원하는 데 큰 잠재력을 가지고 있음을 보여줍니다.