수준은 고위 병리학자 수준과 거의 같습니다! 청화대 연구팀은 신경교종의 정확한 진단을 달성하기 위해 AI 기반 모델 ROAM을 제안했습니다.

신경교종은 뇌의 신경교세포에서 기원하는 종양으로, 중추신경계 원발성 종양의 40~60%를 차지하며 성인에서 가장 흔한 원발성 두개내 종양으로 알려져 있습니다. 신경교종의 조직병리학적 분류는 매우 복잡하며 일반적으로 별아교세포종, 과소교세포종, 상피세포종의 세 가지 하위 유형으로 나뉘며, 각 하위 유형은 다시 여러 등급으로 나뉩니다. 그러므로,정확한 분류와 등급은 신경교종의 예후와 치료에 매우 중요합니다.
신경교종 진단은 일반적으로 경험이 풍부한 병리학자가 조직 절편을 관찰하여 완료합니다. 그러나 이 방법은 병리학자의 부족, 주관적인 진단, 시간이 많이 걸리는 진단 과정 등의 문제점을 가지고 있습니다.현재로서는 신경교종의 진단 요구를 충족시키기 어렵습니다.
최근 디지털 병리학과 머신 러닝의 발전으로 조직학 단면을 디지털화할 수 있게 되었고, 이를 풍부한 맥락적 데이터를 포함하는 기가픽셀 전체 슬라이드 이미지(WSI)로 변환하여 진단, 예후, 분자적 특성 분석에 큰 잠재력을 제공합니다. 하지만 이러한 방법은 병리학자가 선택한 병리학 이미지에서 관심 영역(ROI)만 분석합니다.슬라이드 전체를 자동으로 분석하는 것은 불가능합니다.
이러한 맥락에서,청화대학교 자동화학과 생명기초모형연구실의 루 하이롱 연구원, 장 루이 교수, 장쉐공 교수, 중남대학교 샹야병원의 후 중량 교수,대규모 관심 영역과 피라미드 변환기를 기반으로 하는 정밀한 병리학적 진단 AI 기본 모델 ROAM은 임상 수준의 신경교종 진단 및 분자 마커 발견을 위해 제안되었으며, 다른 유형의 종양의 병리학적 진단으로 확장될 수 있습니다.
관련 연구 결과는 "임상적 수준의 신경교종 진단 및 분자 마커 발견을 위한 변압기 기반 약감독 계산 병리학 방법"이라는 제목으로 Nature Machine Intelligence에 게재되었습니다.
ROAM은 병리학적 이미지에서 풍부한 다중 스케일 정보를 효과적으로 추출하고 신경교종 종양 감지, 하위 유형 분류/등급, 분자적 특징 예측 등 다양한 분류 작업에 대한 정확한 진단을 달성할 수 있습니다.ROAM은 사내 데이터에 기반하여 탁월한 진단 성능을 입증했으며, 병리학자의 경험에 따라 주요 형태적 특징을 자동으로 포착하고, 신경교종에 대한 정확하고 신뢰할 수 있으며 적응 가능한 임상적 수준의 진단을 제공했습니다.
또한 ROAM은 독립적인 외부 데이터로 확장이 가능하며, 일반화 능력이 뛰어납니다. ROAM은 진단을 시각화하고 설명함으로써 병리학자가 모델의 진단 기준의 신뢰성을 검증하고, 귀중한 정보를 추출하고, 보조 진단을 촉진하여 의료 서비스를 개선하는 데 도움을 줄 수 있습니다. 가장 중요한 점은 ROAM이 분자적, 형태적 바이오마커의 발견을 촉진하여 신경교종의 진단과 치료에 대한 새로운 통찰력을 제공한다는 것입니다.
연구 하이라이트:
* ROAM은 대형 이미지 패치와 다중 스케일 기능 학습 모듈을 통해 전체 슬라이스 조직 병리 이미지의 시각적 표현을 효율적으로 추출합니다.
* ROAM은 독립적인 외부 데이터로 확장 가능하며, 뛰어난 일반화 능력을 가지고 있습니다.
* ROAM은 분자 및 형태학적 바이오마커의 발견을 촉진하여 신경교종 진단 및 치료에 대한 새로운 통찰력을 제공합니다.

서류 주소:
https://www.nature.com/articles/s42256-024-00868-w
데이터세트 다운로드:
오픈소스 프로젝트인 "awesome-ai4s"는 100개가 넘는 AI4S 논문 해석을 모아 방대한 데이터 세트와 도구를 제공합니다.
https://github.com/hyperai/awesome-ai4s
데이터 세트: 두 가지 주요 디지털 조직 병리학 슬라이드 데이터 세트
이 연구에서는 신경교종 연구를 위해 두 개의 대규모 디지털 조직병리 슬라이드(WSI) 데이터 세트를 수집했습니다.
1. Xiangya Glioma WSI 데이터 세트
이 데이터 세트는 중남대학교 샹야병원의 신경교종 단면에서 추출되었습니다.아래 그림에서 볼 수 있듯이, 여기에는 동일한 수의 서로 다른 사례에서 ×40 배율로 처리된 1,109개의 WSI가 포함되어 있으며, 신경교종 감지, 하위 유형 분류, 등급 지정, 분자적 특징 예측과 같은 진단 작업을 포함하며, 각 사례에 대해 동일한 수의 슬라이스가 수집되었습니다.

이 데이터 세트에는 530개의 성상교종, 224개의 과아교종, 213개의 상피세포종의 하위 유형과 등급을 나타내는 슬라이스 수준 주석만 포함되어 있습니다. 또한, IDH 돌연변이가 있는 634건과 MGMT 프로모터 메틸화가 있는 641건에 대해 분자 검사를 시행했습니다.
데이터 세트는 무작위로 두 부분으로 나뉩니다.하나는 모델 학습에 사용되는 736개의 WSI를 포함하는 내부 학습 데이터 세트입니다. 다른 하나는 모델 평가와 의사 관련 실험에 사용되는 373개의 WSI를 포함하는 내부 테스트 데이터 세트입니다. 두 데이터 세트의 클래스 비율은 전체 데이터 세트의 클래스 비율과 동일합니다.
2. TCGA 신경교종 WSI 데이터 세트
또 다른 신경교종 조직병리학 WSI 데이터 세트는 뇌 저등급 신경교종 및 신경교모세포종 프로젝트에서 나왔습니다.총 860개의 신경교종 절편(389건)과 844개의 저등급 신경교종 절편(491건)이 있습니다. 진단 기준은 Xiangya 데이터 세트에서 사용된 기준과 다르므로 데이터의 슬라이스 수준 주석만 보존됩니다. Xiangya 데이터 세트에 주석을 단 두 명의 병리학자가 2016년 진단 지침 버전에 따라 이 섹션의 진단 결과를 검토하고 수정하도록 초대되었습니다.
마지막으로 검토된 데이터 세트에는 Xiangya 데이터 세트와 일치하는 4가지 작업을 다루는 ×40 및 ×20 배율의 618개 WSI가 포함됩니다. 이 데이터 세트는 신경교종 하위 유형 분류, 등급 및 분자적 특징 예측을 위한 외부 테스트 데이터 세트로 사용됩니다.
모델 아키텍처: 대규모 지역 관심 및 피라미드 변압기 기반
ROAM은 약하게 감독되는 계산 병리학 방법입니다.이 방법은 다중 인스턴스 학습을 기본 프레임워크로 사용하고, 대규모 조직 이미지 블록을 기본 연구 단위로 사용하고, 피라미드 변압기를 사용하여 각 조직 블록의 스케일 내 및 스케일 간 상관 관계를 체계적으로 학습하여 전체 조직 슬라이스 이미지의 시각적 표현을 효과적으로 추출합니다.
첫 번째,ROAM은 각 전체 슬라이스 이미지에 대해 조직 분할을 수행하고 이를 기본 단위로 하여 후속 분석의 기본 단위인 ROI(2048×2048)로 큰 크기의 조직 이미지 패치를 추출합니다. 이는 다음 그림과 같이 WSI 패칭에 표시됩니다.

둘째,각 ROI는 두 번씩 연속적으로 다운샘플링되어 서로 다른 배율의 이미지 세 개가 생성되었습니다. 그런 다음 각 이미지를 작은 이미지 패치로 분할하고, 이 패치는 사전 훈련된 합성 신경망을 통해 인코딩하여 시각적 표현을 추출합니다. 이 표현은 아래 그림 b의 왼쪽에 있는 인스턴스 기능 추출에서 볼 수 있듯이 MIL 모델의 입력으로 사용됩니다. 다중 스케일 자기 주의(SA) 모듈과 주의 네트워크는 인스턴스 수준 표현을 생성하는 데 사용되며, 이 정보는 아래 그림 b의 오른쪽에 있는 다중 스케일 기능 추출에 표시된 것처럼 슬라이스 수준 표현으로 집계됩니다.

마침내,그림 c(인스턴스 기능 집계)에서 볼 수 있듯이, 두 가지 유형의 SA 모듈은 피라미드 변압기 아키텍처를 사용하여 고배율에서 저배율로 점진적으로 다중 스케일 기능을 융합하여 조직 블록의 다중 스케일 시각적 표현을 얻습니다. 내부 규모 SA 모듈과 규모 간 SA 모듈은 각각 ROI의 내부 규모 및 규모 간 관련 기능을 학습합니다. 두 모듈 모두 여러 개의 멀티헤드 SA 레이어와 피드포워드 레이어를 포함합니다.

연구 결과: ROAM, 신경교종 정확한 진단 달성
ROAM, 신경교종 정확한 진단 달성
연구자들은 내부 데이터 세트와 TCGA 외부 데이터 세트에 대한 ROAM의 분류 성능을 평가했습니다.
아래 그림 a에서 볼 수 있듯이 ROAM은 CLAM, TransMIL, GTP, TEA-graph 및 H(2)MIL을 포함한 5가지 방법보다 성능이 뛰어나며 내부 데이터 세트에 대한 신경교종 진단과 관련된 작업에서 다른 기준 방법보다 성능이 뛰어납니다. 정상, 신경교증, 종양의 3가지 유형의 신경교종을 검출하는 데 있어 ROAM의 거시 평균 1:1 ROC 곡선 면적(AUC)은 0.990±0.002였습니다.

세 가지 신경교종 하위 유형, 즉 성상세포종, 과소교종, 상피세포종을 분류할 때 ROAM의 AUC는 아래 그림 b에서 볼 수 있듯이 0.950±0.003이었습니다.

이러한 신경교종 진단 작업에서 ROAM은 모든 기준 방법 중에서 가장 높은 AUC를 달성했습니다.ROAM 모델은 신경교종 진단에 효과적이고 높은 성능을 보이는 것으로 입증되었습니다.
동시에,ROAM은 또한 우수한 일반화 특성을 가지고 있습니다.내부 데이터 세트로만 학습하고 외부 TCGA 데이터 세트로 테스트한 ROAM은 전반적으로 다른 기준 방식보다 우수한 성과를 보였습니다. 또한,ROAM 예측의 시각화 결과는 또한 이 방법으로 요약된 진단 근거가 임상 진단 기준과 매우 일치한다는 것을 보여줍니다.
ROAM은 신경교종의 임상 보조 진단을 크게 발전시킵니다.
연구자들은 ROAM에 대한 포괄적인 임상적 평가를 실시했습니다.신경교종의 보조 진단에 있어 ROAM의 성능을 연구했습니다. 5명의 병리학자로 구성된 3개 그룹이 연구에 참여하도록 초대되었습니다. 한 그룹은 임상 경험이 5년 미만인 초급 병리학자였고, 두 그룹은 임상 경험이 5~15년인 중급 병리학자였으며, 나머지 두 그룹은 임상 경험이 15년 이상인 선임 병리학자였습니다.
아래 그림에서 보듯이, 제안된 시스템은 신경교종 연쇄 진단의 5가지 과제에서 좋은 성과를 보였으며, 5명의 병리학자 중 4명의 성과를 능가했고, 성과가 가장 좋은 선임 병리학자(선임 1)와 비슷했습니다. 특히, 신경교종 검출에 있어서,새로운 시스템은 모든 병리학자보다 훨씬 뛰어난 성과를 보였습니다.아래 그림 f에 표시된 것처럼 21,30%를 초과하는 가장 우수한 성과를 보인 병리학자도 포함됩니다.

그런 다음 연구자들은 세 명의 중급 및 고급 병리학자에게 ROAM을 사용하여 진단을 수행하도록 요청하여 진단 성능이 향상되었는지 조사했습니다. 결과에 따르면 ROAM의 도움으로 3명의 병리학자의 진단 정확도는 모든 작업에서 평균 7.27%(1차 1), 12.87%(중간 1), 9.96%(중간 2)만큼 향상되었습니다.이는 ROAM의 임상적 적용 가치가 매우 높다는 것을 보여줍니다.
ROAM은 신경교종의 분자적 형태학적 마커 발견을 촉진합니다.
연구진은 ROAM의 도움으로 신경교종 진단과 관련된 주요 분자적 특징의 형태학적 발현을 탐구했고, ROAM이 이소시트르산 탈수소효소(IDH) 돌연변이를 예측하는 분자적 특징 작업에서 좋은 성과를 보인다는 것을 발견했습니다. 그들은 이 작업에서 ROAM의 예측 결과에 대한 완전한 시각적 분석을 수행했으며, ROAM이 집중한 주요 영역의 조직 형태적 특징을 분석하고 요약했습니다. 그들은 호산구 증가, 균일한 세포질, 핵의 어두운 염색이 IDH 돌연변이의 병리학적 이미지에서 흔히 나타나는 것을 발견했습니다.

이 중요한 발견은 의사들이 분자 검사를 사용하지 않고도 IDH 상태를 사전 예측하는 데 도움이 되며, 신경교종에 대한 임상 진단 기준을 최적화하고 개선하는 데 크게 기여할 것입니다.
청화대학교 자동화학과 생명기초모형연구실, 생명과학 연구 활성화 위해 AI 적극 추진
본 논문에서는중남대학 샹야병원의 뤼 하이롱(Lü Hairon) 연구원, 장쉐공(Zhang Xuegong) 교수, 후 종량(Hu Zhongliang) 교수가 책임 저자입니다.청화대학교의 장루이 교수와 석사과정인 인샤오쉬, 중국 모바일 연구소의 양펭슈아이, 샹야 병원의 정링차오가 이 논문의 공동 제1 저자로 참여했습니다. Hu Jun, Yang Jiao, Wang Ying, Fu Xiaodan, Shang Li, Li Liling, Lin Wei 및 Zhou Huan은 본 연구의 데이터 수집 및 주석에 참여했습니다. 천푸쉰과 푸저우 데이터기술연구소는 온라인 소프트웨어 플랫폼에 대한 R&D 지원을 제공했습니다.
이 연구의 주요 기여자 중 한 명으로서,청화대학교 자동화학과 생명기초모형연구실은 첨단 인공지능 기술을 활용해 생명과학 연구를 강화하는 방법을 끊임없이 연구하고 있습니다.
올해 6월에는 청화대학교 자동화학과 생명기초모형연구실장 장쉐공 교수, 전자/공기공학과 마젠주 교수, 생명공학과 송레 박사 등이 참석했다.scFoundation이라 불리는 대형 세포 모델이 확립되었습니다.이 모델은 5,000만 개의 세포에서 얻은 유전자 발현 데이터를 기반으로 훈련되었으며, 1억 개의 매개변수를 가지고 있으며, 약 20,000개의 유전자를 동시에 처리할 수 있습니다. 기본 모델로서, "가상 약물 시험"과 같은 다양한 생물의학 하위 작업에서 탁월한 성능 향상을 보였습니다.단일 세포 연구에서 인공지능에 대한 새로운 패러다임을 제공합니다.
해당 연구 결과는 "단일 세포 전사체학의 대규모 기초 모델"이라는 제목으로 Nature Methods에 게재되었습니다.전체 보고서를 보려면 클릭하세요: "1억 개의 매개변수를 가진 세포 모델이 출시되었습니다! Nature 하위 저널에 게재된 칭화대학교 연구팀, scFoundation 발표: 2만 개 유전자 동시 모델링"

scFoundation 모델은 생명 과학의 기초 연구, 세포 교란 반응 예측, 약물 표적 발견 및 기타 분야에 혁신적인 방법과 도구를 제공합니다. 또한 모델 아키텍처, 훈련 프레임워크, 다운스트림 시연 응용 시스템 측면에서 대규모 세포 모델 연구를 위한 새로운 아이디어와 방법을 제공합니다. 이는 단일 세포 분야에서 기본 모델의 경계를 성공적으로 확장하고 디지털 공간에서의 가상 약물 실험과 같은 미래 연구를 위한 토대를 마련했습니다.
앞으로 청화대학교 자동화학부 생명기초모형연구실은 인공지능과 생명과학의 학제간 분야에서 연구를 계속할 것입니다. AI 기술의 지속적인 발전과 개선에 따라 생명과학 분야에 인공지능을 적용하면 의료기술의 진보가 크게 촉진되고, 진단과 치료의 정확도가 높아지며, 의료비가 절감되고, 궁극적으로 인간의 건강과 삶의 질이 향상될 것입니다.
참고문헌:
1.https://www.nature.com/articles/s42256-024-00868-w
2.https://mp.weixin.qq.com/s/oB3kTgcgObawPKU-75KsHQ
3.https://mp.weixin.qq.com/s/nflI4PVTJB3xVPXuA5zbZQ
행동 촉구
HyperAI(hyper.ai)는 데이터 과학 분야에서 중국 최대의 검색 엔진입니다. 이 회사는 오랫동안 AI for Science의 최신 연구 결과에 집중해 왔으며, 최고 저널에 실린 100편 이상의 학술 논문을 해석해 왔습니다.
과학을 위한 AI에 대한 연구와 탐구를 진행하는 연구 그룹과 팀은 최신 연구 결과를 공유하고, 심층적인 해석 논문을 기고하고, Meet AI4S 라이브 방송 칼럼에 참여하기 위해 저희에게 연락해 주시기 바랍니다. AI4S를 홍보할 수 있는 더 많은 방법을 함께 탐색해 보세요!
WeChat 추가: PH (WeChat ID: G18539589505)