Command Palette
Search for a command to run...
케임브리지 대학은 혈액 세포 이미지 분류기를 개발했습니다. 이 기술의 확산 모델은 백혈병 탐지에 도움이 되며 임상 전문가의 역량을 뛰어넘습니다.

혈액 세포 영상 분석은 임상 진단 및 과학 연구에 중요한 역할을 합니다. 백혈구, 적혈구, 혈소판의 형태학적 특성은 혈액계의 건강 상태를 반영할 뿐만 아니라 백혈병이나 골수이형성증후군과 같은 초기 질병 징후를 나타낼 수도 있습니다. 그러나 기존의 수동 현미경 분석은 숙련된 전문가의 수동 분류에 의존하는데, 이는 비효율적이고 시간이 많이 소요되며 주관적인 편향이 발생할 수 있습니다.
최근 몇 년 동안 의료 영상 분석 분야에서 딥러닝 기술이 점점 더 많이 적용되고 있으며, 일부 연구에서는 판별 모델, 특히 합성곱 신경망(CNN)을 혈액 세포 형태 평가에 적용하려는 시도가 있었습니다. 가장 우수한 판별 ML 분류 모델은 세포를 미리 정의된 범주로 분류하는 데 있어 인간의 성능에 근접할 수 있지만, 주로 전문가 레이블을 기반으로 결정 경계를 학습합니다. 따라서,이들은 본래 세포 형태의 완전한 데이터 분포를 포착하도록 설계되지 않았습니다.이러한 제한으로 인해 특히 임상 혈액학 데이터의 본질적인 복잡성과 변동성에 직면했을 때 역량이 저하됩니다.
이러한 맥락에서,영국 케임브리지 대학의 연구팀은 확산 모델을 기반으로 한 혈액 세포 이미지 분류 방법인 CytoDiffusion을 제안했습니다.혈액 세포의 형태학적 분포를 충실하게 모델링하고 정확한 분류를 달성하며, 강력한 이상 탐지 기능, 분포 변화에 대한 저항성, 해석 가능성, 높은 데이터 효율성, 임상 전문가를 능가하는 불확실성 정량화 기능을 갖추고 있습니다.
이 모델은 이상 탐지(AUC: 0.990 대 0.916), 분포 변화에 대한 견고성(정확도: 0.854 대 0.738), 저데이터 시나리오에서의 성능(균형 잡힌 정확도: 0.962 대 0.924) 측면에서 최첨단 판별 모델보다 우수한 성능을 보였습니다.이 연구에서 개발된 포괄적인 평가 프레임워크는 혈액학적 의료 영상 분석을 위한 다차원적 벤치마크를 확립했으며, 이는 임상 환경에서 진단 정확도를 향상시킬 것으로 기대됩니다.
"혈액 세포 형태의 심층적 생성 분류"라는 제목의 관련 연구 결과가 Nature에 게재되었습니다.
연구 하이라이트:
* 잠재 확산 모델을 혈액 세포 이미지 분류에 적용합니다.
* 정확도와 같은 표준 지표를 넘어 분포 변화에 대한 견고성, 이상 감지 기능, 저데이터 시나리오에서의 성능 등을 통합한 평가 프레임워크를 제안합니다.
* 기존 데이터 세트의 주요 한계를 해결하고, 이미징 아티팩트와 주석자 신뢰도를 포함하는 새로운 혈액 세포 이미지 데이터 세트를 구성합니다.

서류 주소:
https://www.nature.com/articles/s42256-025-01122-7
공개 계정을 팔로우하고 "세포 확산전체 PDF를 받으세요
데이터 세트 주소:
더 많은 AI 프런티어 논문:
https://hyper.ai/papers
데이터 세트: 공개적으로 사용 가능한 데이터 세트와 맞춤형 데이터 세트 결합
데이터는 혈액 세포 이미지 분석의 기반이며 AI 모델의 성능과 일반화 능력에 대한 핵심 보장입니다. CytoDiffusion 팀은 5개의 데이터 세트를 사용했는데, 그 중 4개는 공개적으로 사용 가능하고 나머지 하나는 CytoData라는 자체 구축 데이터 세트입니다.
CytoData 데이터셋은 케임브리지 애든브룩스 병원의 혈액 도말 표본 2,904개를 포함하는 익명화된 데이터셋으로, 총 559,808개의 단일 세포 이미지를 포함합니다. 이 중 4,996개의 이미지는 적혈구, 호산구, 단핵구, 미성숙 세포를 포함한 10가지 혈액 세포 유형으로 분류되어 있습니다. 이미지는 CellaVision DM9600 시스템을 사용하여 수집되었으며, 주석에는 각 주석 전문가의 신뢰도 점수가 포함되어 있어 이후 불확실성 정량화에 중요한 참고 자료를 제공합니다. CytoData는 또한 혈액 도말 표본에서 흔히 발생하는 비세포적 구조 간섭을 해결하기 위한 아티팩트 범주를 포함하고 있으며, 이는 임상 적용에 매우 중요합니다.
Raabin-WBC, PBC, Bodzas, LISC 등 4개의 공개 데이터 세트이 데이터셋은 다양한 현미경, 염색 방법 및 장비를 사용하여 얻은 혈구 이미지를 포함합니다. Raabin-WBC는 Test-A와 Test-B 파티션을 제공하며, Test-B는 영역 이동을 시뮬레이션하기 위해 훈련 세트와 다른 수집 장비를 사용합니다. 장비 및 염색 방법의 차이로 인해 LISC 데이터셋은 모델의 일반화 능력에 더 중점을 둡니다.

이러한 다중 소스 데이터 세트를 결합함으로써 팀은 모델 학습의 다양성을 보장할 뿐만 아니라, 데이터가 부족한 조건에서 교차 도메인 성능 평가, 비정상 세포 감지 및 모델 테스트를 위한 완벽한 기반을 제공했습니다.
데이터 세트 주소:
프레임워크: 혈액 세포 이미지 분류에 확산 모델 적용
CytoDiffusion의 핵심 혁신은 혈액 세포 이미지 분류에 확산 모델을 적용하는 데 있습니다.기존의 판별 모델과 달리 확산 모델은 생성적 속성을 가지고 있어 이미지의 전체 분포를 학습하고 노이즈 예측 메커니즘을 통해 분류할 수 있습니다.

모델 원칙
확산 모델의 핵심 원리는 데이터를 점진적으로 잡음을 추가하여 잡음과 유사한 분포로 변환하는 순방향 확산 과정을 정의하는 것입니다. 그런 다음 모델은 데이터의 잡음을 제거하는 역방향 확산 과정을 학습하여 원래 데이터 분포를 효과적으로 재구성합니다.
잠재 공간 인코딩:입력 이미지는 먼저 인코더를 통해 잠재 공간에 매핑되고, 그 다음에 가우시안 노이즈가 추가되어 노이즈가 있는 잠재 표현을 형성합니다.
조건부 확산:이 모델은 각 세포 유형에 대한 노이즈 예측을 생성하고 예측된 노이즈와 실제 노이즈 간의 오차를 최소화하여 분류를 달성합니다.
점차적으로 제거하세요:모든 후보 범주에 대해 반복적 샘플링을 수행하고, 최종 범주가 결정될 때까지 짝지어진 학생 t 검정을 사용하여 불가능한 범주를 단계적으로 제거합니다.
일반 교육 설정
연구진은 Stable Diffusion 1.5를 기본 모델로 사용했습니다.범주 기반 조건의 경우, 토크나이저와 텍스트 인코더를 거치지 않고 각 범주에 대해 원핫 인코딩된 벡터를 직접 제공합니다. 이 벡터들은 77×768 차원 행렬에 맞춰 수직으로 복사되고 수평으로 패딩됩니다. 배치 크기는 10, 학습률은 10⁻⁵, 선형 워밍업은 1000단계로 구성되었으며, A100-80GB GPU에서 학습이 수행되었습니다.
훈련 및 추론
연구자들은 무작위 대각선 뒤집기, 무작위 회전(0~359도 사이에서 균일한 샘플링), 색상 지터(밝기 = 0.25, 대비 = 0.25, 채도 = 0.25, 색상 = 0.125), Mixup(α = 0.3, 대상이 아닌 조건부 입력에 적용), RandAugment(기본 매개변수 사용)를 포함한 다양한 데이터 증강 방법을 훈련 중에 적용했습니다.
학습에는 AdamW 옵티마이저(β1 = 0.9, β2 = 0.999, ϵ = 10⁻⁸, 가중치 감소 0.01), 혼합 정밀도 학습(fp16), 그리고 지수 이동 평균(0.9999)을 사용했습니다. 모든 이미지는 360 × 360 픽셀로 균일하게 크기가 조정되었습니다.
추론 단계에서는 학습 단계와 동일한 데이터 증강 방법을 적용했지만, Mixup은 제외했습니다. 백혈구가 일반적으로 이미지 중앙에 위치한다는 점을 활용하고, 이미지 가장자리 영역 증강으로 인한 간섭을 줄이기 위해, 추론 오차는 잠재 공간의 이미지 중앙에서 반경 20픽셀 이내에서만 계산되었습니다. 잠재 공간의 크기는 45 × 45 × 4였습니다.
결과 쇼케이스: CytoDiffusion은 임상 배포에서 발생하는 주요 과제를 해결하는 데 도움이 될 수 있습니다.
이미지 생성 및 진위 검증
인공지능 시스템의 임상 적용에는 고성능뿐만 아니라 신뢰할 수 있는 표현 능력도 요구됩니다. CytoDiffusion이 인공물과 같은 "단축키"에 의존하지 않고 혈액 세포의 실제 형태학적 분포를 학습한다는 것을 입증하기 위해 연구진은 현실성 테스트를 수행했습니다.
32,619개의 훈련 이미지를 기반으로 CytoDiffusion으로 생성된 혈액 세포 이미지는 실제 이미지와 거의 구별할 수 없습니다. 10명의 혈액학자가 2,880개의 이미지에 대해 식별 테스트를 수행하여 전체 정확도 0.523(무작위 추측 수준), 민감도 0.558, 특이도 0.489를 달성했습니다. 이는 무작위 추측 수준에 가까운 성능으로, 숙련된 전문가조차도 CytoDiffusion으로 생성된 혈액 세포 이미지가 실제 이미지와 거의 구별할 수 없음을 시사합니다.
실제 이미지와 거의 구별할 수 없는 이미지를 생성하는 능력은 CytoDiffusion이 아래 그림에서 볼 수 있듯이 혈액 세포 형태의 실제 분포를 성공적으로 학습했다는 것을 나타냅니다.

CytoData 비교: 왼쪽 행렬은 CytoDiffusion의 결과를 보여주고, 오른쪽 행렬은 인간 전문가의 평균 성과를 보여줍니다.
분류 성능
CytoDiffusion은 네 가지 데이터셋(CytoData, Raabin-WBC, PBC, Bodzas)에서 기존 판별 모델의 성능을 달성하거나 능가합니다. 특히 CytoData, PBC, Bodzas에서 이 모델은 최첨단 성능을 달성하여, 아래 표에서 볼 수 있듯이 확산 기반 방법이 기존 판별 모델과 동등하거나 더 나은 성능을 낼 수 있음을 보여줍니다.

불확실성 정량화는 인간 전문가보다 우수합니다.
생물학적 시스템은 본질적으로 환원 불가능한 불확실성을 가지고 있습니다. 모든 분석 작업에서 측정은 예측의 정확성뿐만 아니라 행위자(인간이든 기계든)의 불확실성에도 초점을 맞춰야 합니다.
연구자들은 아래 그림에서 보듯이, 기존의 베이지안 심리측정 모델링 기법을 사용하여 CytoDiffusion의 심리측정 함수를 도출했습니다.결과는 모델이 매우 잘 맞는다는 것을 보여주며, 주요 임계값과 너비 매개변수의 사후 분포가 매우 컴팩트하다는 것을 보여줍니다(아래 그림의 내장된 좌표축).직접적으로 측정할 수는 없지만, 이러한 결과는 CytoDiffusion의 불확실성이 주로 우연적 요소에 의해 지배되며, 그 행동이 이상적인 관찰자의 행동과 매우 유사하다는 것을 시사합니다.

저데이터 환경에서의 비정상 셀 감지 및 성능
비정상 세포 검출의 경우, CytoDiffusion은 Bodzas 데이터셋에서 원시 세포를 비정상 범주로 사용했을 때 높은 민감도(0.905)와 높은 특이도(0.962)를 달성했습니다. 반면, ViT는 매우 낮은 민감도(0.281)를 보였으며, 아래 그림에서 볼 수 있듯이 임상 적용의 요구를 충족하지 못했습니다.

클래스당 10~50개의 학습 이미지만 있는 저데이터 환경에서 CytoDiffusion은 EfficientNetV2-M 및 ViT-B/16보다 훨씬 우수한 성능을 보이며, 아래 그림에서 볼 수 있듯이 데이터가 부족한 조건에서도 효율적인 학습 능력을 보여줍니다.

모델 일반화 능력
모델의 일반화 능력을 평가하기 위해 연구진은 다양한 데이터 영역에서 성능을 테스트했습니다. Raabin-WBC로 학습된 모델은 Test-B(다양한 현미경과 카메라 사용) 및 LISC(다양한 현미경, 카메라 및 염색 방법 사용) 데이터셋에서 테스트되었고, CytoData로 학습된 모델은 PBC와 Bodzas 데이터셋에서 테스트되었습니다. CytoDiffusion은 네 가지 데이터셋 모두에서 최고 수준의 정확도를 달성했습니다.다양한 정도의 도메인 드리프트에 걸쳐 나타나는 이러한 일관성 이점은 CytoDiffusion이 데이터 세트 변화에도 견고하고 실제 임상 시나리오에서 우수한 일반화 능력을 보유하고 있음을 보여줍니다.
설명 가능성 검증
반사실적 히트맵 분석을 통해 모델은 아래 그림과 같이 세포 내 주요 형태학적 특징을 식별할 수 있습니다. 예를 들어, 단핵구에서 미성숙 과립구로의 전환 과정에서 모델은 세포질 산도와 액포 충만 특성의 차이를 강조합니다. 이러한 시각화는 모델의 학습 능력을 검증할 뿐만 아니라 잠재적 편향을 감지하여 분류 기준이 임상 과학적 논리와 일치하는지 확인하는 데에도 사용될 수 있습니다.

확산 모델은 생물의학 분야에서 획기적인 것으로 입증되고 있습니다.
CytoDiffusion의 연구는 혈액 세포 형태 분류에 있어서 확산 모델의 잠재력을 보여줄 뿐만 아니라, 생물의학 분야 전체에서 확산 기반 생성 프레임워크의 급속한 성장을 반영하며, 다양한 응용 시나리오에서 획기적인 가치를 보여줍니다.
예를 들어, 의료 데이터는 제한적이고 심각한 개인정보 보호 문제에 직면하는 경우가 많아 데이터 수집 및 주석 처리가 큰 과제가 됩니다. 확산 모델은 합성 의료 이미지를 생성하여 이 문제를 해결할 수 있습니다.이는 딥러닝 모델을 훈련하고 의료 영상 분석의 정확도를 향상시키는 데 도움이 됩니다.일반적인 의료 이미지를 생성하는 것 외에도...분산 모델은 특정 상태(종양, 골절 등)에 대한 의료 이미지를 생성하는 데에도 사용될 수 있습니다.이는 의료 진단 모델을 학습할 때 특히 중요한데, 희귀 질환이나 획득하기 어려운 이미지에 대한 더 많은 학습 샘플을 제공할 수 있기 때문입니다. 동시에, 확산 모델은 선명하고 사실적인 고품질 이미지를 생성할 수 있어 의사의 진단 정확도를 향상시킬 뿐만 아니라 의료 AI 시스템이 더욱 정확한 예측을 내릴 수 있도록 지원합니다.
많은 임상 및 연구 시나리오에서 고품질 의료 영상 데이터 세트의 부족은 임상 응용 분야에서 인공지능(AI)의 잠재력을 저해합니다. 2024년 12월, 원저우 의과대학 부속 안과병원의 강 장 교수와 지아 추 교수, 그리고 베이징대학교의 왕진주오 연구원이 교신저자로 참여했으며, 베이징대학교의 카이 왕 박사와 중산대학교 중산기념병원의 유운팡 박사가 공동 제1저자로 참여했습니다.확산 모델을 기반으로 하는 새로운 프레임워크인 MINIM이 개발되었습니다. 이 모델은 텍스트 명령을 기반으로 다양한 장기의 다양한 영상 모달리티에 대한 의료 영상을 생성할 수 있습니다.임상가의 평가와 엄격한 객관적 측정을 통해 MINIM에서 생성된 이미지의 높은 품질이 검증되었습니다. 전례 없는 데이터 영역에 직면했을 때, MINIM은 향상된 생성 능력을 보여주며 일반 의료 AI(GMAI)로서의 잠재력을 입증했습니다.
논문 제목:합성 의료 영상 생성 및 임상 응용을 위한 자체 개선형 생성 기반 모델
서류 주소:https://www.nature.com/articles/s41591-024-03359-y
세포생물학 연구에서 살아있는 세포는 화학적 평형과는 거리가 먼 복잡한 소산계입니다. 외부 자극에 대한 세포의 집단적 반응은 과학자들이 끊임없이 탐구해 온 핵심적인 과학적 질문입니다. 2025년 11월컬럼비아 대학, 스탠포드 대학 및 기타 기관의 연구팀은 Squidiff 계산 프레임워크를 개발했습니다.조건부 잡음 제거 확산 암묵적 모델을 기반으로 구축된 이 프레임워크는 분화 유도, 유전자 교란, 그리고 약물 치료 하에서 다양한 세포 유형의 전사체 반응을 예측할 수 있습니다. 이 프레임워크의 핵심 장점은 유전자 편집 도구와 약물 화합물로부터 얻은 명시적 정보를 통합할 수 있다는 것입니다. 줄기세포 분화를 예측할 때, 이 프레임워크는 일시적인 세포 상태를 정확하게 포착할 뿐만 아니라 비가산적 유전자 교란 효과와 세포 특이적 반응 특성을 파악할 수 있습니다. 연구팀은 Squidiff를 혈관 오가노이드 연구에 적용하여 다양한 세포 유형에 대한 방사선 노출의 영향을 성공적으로 예측하고 방사선 보호 약물의 보호 효능을 평가했습니다.
논문 제목:Squidiff: 확산 모델을 사용하여 세포 발달 및 교란에 대한 반응 예측
서류 주소:https://www.nature.com/articles/s41592-025-02877-y
생성적 기본 모델이 의학 분야에서 더욱 발전함에 따라 확산 모델이 더욱 실제적인 임상 시나리오에 구현되어 일반 의료 지능을 위한 중요한 기반이 되고, 향후 의료 영상 진단, 질병 예측 및 지능형 의사 결정을 위한 더 높은 신뢰성, 강력한 일반화 능력 및 더 폭넓은 적용 범위를 제공할 것으로 예상됩니다.
참고문헌:
1.https://www.nature.com/articles/s42256-025-01122-7
2.https://www.nature.com/articles/s41592-025-02877-y
3.https://mp.weixin.qq.com/s/9JEt-QwFxngv9XC0hSIcnw
4.https://bbs.huaweicloud.com/blogs/448218








