Command Palette
Search for a command to run...
데이터 공유 없이도 공동 교육이 가능합니다! UCL 연구팀은 연합 학습을 활용하여 혈액 형태학 검사 방식을 혁신하고 있습니다.

혈액 형태 검사는 혈액 질환의 임상 진단에서 매우 중요한 단계입니다. 말초 혈액 도말 표본(PBS)이나 골수 흡인 검체(BMA)에서 세포 형태를 관찰함으로써 의사는 백혈병, 빈혈, 감염 및 유전성 혈액 질환의 유형을 판별할 수 있습니다. 그러나 이 과정은 노동 집약적일 뿐만 아니라 숙련된 전문가에 크게 의존합니다. 특히 저소득 및 중소득 국가(LMICs)에서는 숙련된 전문가가 부족하여 신속하고 신뢰할 수 있으며 확장 가능한 혈액학적 진단법이 시급한 과제입니다.
최근 인공지능과 딥러닝의 발전은 혈액 형태 분석에 새로운 해결책을 제시했습니다. AI 모델은 다양한 유형의 백혈구를 자동으로 식별하여 의사가 신속하게 진단하는 데 도움을 줄 수 있습니다.연구 결과에 따르면 딥러닝은 자동화된 혈액학 진단 분야에서 상당한 잠재력을 가지고 있습니다.하지만 실제 적용에는 여전히 상당한 어려움이 남아 있습니다. 모델 학습은 데이터에 크게 의존하는데, 임상 데이터는 일반적으로 여러 병원에 분산되어 있고 염색 방법, 영상 장비, 일부 희귀 세포 유형의 차이로 인해 이질성이 발생합니다. 이러한 데이터 이질성은 새로운 기관이나 환자 집단에서 모델의 일반화 능력을 저하시킬 수 있습니다.
더욱 중요한 것은 의료 데이터는 환자의 개인정보와 관련되어 있으며, 기관 간 데이터 공유는 엄격하게 제한된다는 점입니다. 기존의 중앙 집중식 학습 방식은 일반적으로 대량의 민감한 의료 데이터를 수집해야 하고 고성능 컴퓨팅 자원을 필요로 하기 때문에 많은 기관에서 구현하기 어렵습니다. 개인정보를 보호하면서 여러 기관이 참여하는 협력 학습을 어떻게 실현할 것인가는 의료 AI 분야에서 시급히 해결해야 할 핵심 과제입니다.
이러한 맥락에서,런던대학교(UCL) 컴퓨터공학과 연구팀이 백혈구 형태 분석을 위한 연합 학습 프레임워크를 제안했습니다.이를 통해 기관들은 훈련 데이터를 교환하지 않고도 협력적인 훈련을 수행할 수 있습니다. 여러 임상 현장에서 얻은 혈액 도말 표본을 활용하여, 연합 모델은 완벽한 데이터 개인정보 보호를 유지하면서 견고하고 도메인 불변적인 특징 표현을 학습합니다. 컨볼루션 네트워크 및 트랜스포머 기반 아키텍처에 대한 평가 결과, 연합 훈련이 기관 간 성능 및 알려지지 않은 기관에 대한 일반화 측면에서 중앙 집중식 훈련보다 우수한 것으로 나타났습니다.
"MORPHFED: 기관 간 혈액 형태 분석을 위한 연합 학습"이라는 제목의 관련 연구 결과는 arXiv에 사전 공개 논문으로 게시되었습니다.
연구 하이라이트:
* 중앙 집중식 교육과 비교했을 때, 연합형 교육은 여러 사이트에서 우수한 성능을 보이며, 알려지지 않은 기관에도 적용 가능한 일반화 능력을 보여줍니다.
이 방법은 원시 데이터를 공유하지 않고도 기관 간 협업 모델 학습을 가능하게 하여 자원이 제한된 의료 환경에 적합한 해결책을 제공합니다.

서류 주소:
https://arxiv.org/abs/2601.04121
저희 공식 위챗 계정을 팔로우하고 백그라운드에서 "MORPHFED"라고 답장하시면 전체 PDF 파일을 받으실 수 있습니다.
데이터셋: 실제 임상 환경의 이질성을 반영
본 연구에서는 여러 의료기관의 혈액 도말 데이터를 활용하여 훈련 데이터가 다양한 세포 유형을 포함할 뿐만 아니라 실제 임상 환경의 이질성을 반영하도록 했습니다.
구체적으로, 이 연구는 두 센터에서 얻은 독립적인 데이터 세트를 사용했습니다.이 두 데이터 세트에는 호중구, 호산구, 호염기구, 전골수구 등과 같은 11가지 일반적인 세포 유형이 포함되어 있습니다.이 방법은 염색 및 영상의 차이를 유지하면서 분류 목표의 일관성을 보장하며, 실제 이질적인 환경에서 연합 학습의 일반화 능력을 테스트하는 데 사용됩니다.
다음 그림은 다양한 고객 범주의 분포를 보여줍니다.

아래 이미지는 두 개의 학습 데이터 세트에서 추출한 몇 가지 세포 유형의 예시를 보여줍니다.색상 스타일의 차이가 확연히 드러나는데, 이는 모델이 극복해야 할 데이터 편향의 정확한 원인입니다.

또한, 전혀 접해보지 못한 기관 데이터를 기반으로 모델의 성능을 독립적으로 평가하기 위해,본 연구에서는 바르셀로나 임상 병원(고객 3)에서 얻은 12,992개의 이미지를 보존했습니다.이 데이터 세트는 외부 검증 세트로 사용됩니다. 다양한 영상 장비, 염색 방법 및 환자 집단을 포함하며, 실제 환경에서 여러 기관에 걸쳐 모델의 일반화 능력을 테스트하는 데 사용됩니다.
두 가지 유형의 딥러닝 아키텍처와 네 가지 연합 집계 전략
본 연구에서는 두 가지 유형의 딥러닝 아키텍처를 사용합니다.
* ResNet-34: ImageNet 사전 학습된 가중치를 사용하는 합성곱 신경망(CNN) 기반의 고전적인 아키텍처입니다.
* DINOv2-Small: 자기 지도 학습 방식의 Vision Transformer(ViT)를 기반으로 하며, 자기 지도 학습을 통해 전역 이미지 특징을 추출합니다.
훈련은 통합 프로토콜을 따릅니다. 연합 모델은 5회의 전역 통신을 수행하며, 각 클라이언트는 회차당 5회의 로컬 훈련 사이클을 수행하여 총 25회의 훈련 사이클을 진행합니다. 중앙 집중식 기준 모델은 25회의 훈련 사이클을 사용하고 아래 그림과 같이 4겹 교차 검증을 수행합니다.데이터는 601개의 TP3T 훈련 세트, 13,331개의 TP3T 검증 세트, 13,331개의 TP3T 로컬 테스트 세트 및 13,331개의 TP3T 글로벌 테스트 세트로 나뉘었습니다.모든 이미지는 224×224 픽셀로 크기가 조정되었으며, 진단 형태학적 정보를 보존하기 위해 보수적인 데이터 증강 전략(변환 ±10%, 회전 ±5°)이 적용되었습니다.

(A) 연합 학습 프레임워크는 클라이언트 1과 클라이언트 2가 모델을 로컬에서 학습하고 매개변수를 중앙 서버에 집계하는 개인 정보 보호 협업 학습 프로세스를 보여줍니다.
(B) 병합된 데이터셋에 대한 완전한 접근 권한과 4겹 교차 검증을 사용하는 중앙 집중식 훈련 패러다임.
두 아키텍처 모두 선택적 미세 조정을 사용했습니다. ResNet-34는 초기 레이어를 고정하고 마지막 세 개의 잔여 블록(약 1,100만 개의 파라미터)만 학습했습니다. DINOv2-Small은 처음 8개의 Transformer 블록(0~7)을 고정하고 8~11번째 블록(약 900만 개의 파라미터)을 학습했습니다. 클라이언트 3 데이터는 학습 과정 전반에 걸쳐 분리되어 사용되었으며, 최종 모델의 새로운 기관 데이터에 대한 일반화 능력을 평가하는 데에만 사용되었습니다.
연합 학습 프레임워크에서 중앙 서버는 학습을 조정하고 전역 매개변수를 배포하는 역할을 하지만 원본 데이터에는 접근하지 않습니다. 클라이언트는 로컬에서 학습하고 매개변수 업데이트만 반환합니다.
본 연구에서는 네 가지 연합 집계 전략을 사용했습니다.
* FedAvg: 클라이언트 매개변수의 가중 평균을 계산하며, 극단적인 클래스 분포에 민감합니다.
* FedMedian: 각 좌표의 중앙값을 취합니다. 비정상적인 클라이언트 및 비잔틴 오류에 강건하지만 소수 클래스 신호를 억제할 수 있습니다.
* FedProx: 비IID 데이터에 대한 수렴 안정성을 향상시키기 위해 로컬 목적 함수에 근접 제약 조건을 추가합니다.
* FedOpt: 집계된 기울기에 대한 적응형 최적화(Adam)를 사용하여 학습률을 동적으로 조정함으로써 클라이언트의 이질성에 대처하고 수렴 속도를 높입니다.
또한, 심각한 클래스 불균형 문제를 해결하기 위해 본 연구에서는 소수 클래스의 훈련 신호가 무시되지 않도록 Focal Loss, 가중 무작위 샘플링 및 기울기 누적 전략을 결합했습니다. 기울기 클리핑(최대 노름 1.0)은 훈련 중 안정적인 수렴을 보장합니다.
모델 성능은 균형 정확도를 사용하여 평가했으며, 특히 다양한 영상 프로토콜과 환자 집단의 데이터에 직면했을 때 모델의 견고성을 테스트하기 위해 기관 간 일반화 능력에 중점을 두었습니다.
연합 교육은 여러 기관에 걸쳐 우수한 성능을 보여주며, 알려지지 않은 기관에도 일반화할 수 있는 능력을 입증합니다.
연합 학습 프레임워크의 효과성을 검증하기 위해 연구진은 공동 테스트 세트 평가와 외부 분산 데이터 일반화 평가를 수행했습니다.
① 공동 테스트 세트 평가
해당 모델은 두 클라이언트의 데이터가 포함된 공동 데이터 세트를 사용하여 평가되었으며, 결과는 아래 표에 나와 있습니다. 서로 다른 집계 방법은 다양한 아키텍처에서 성능에 상당한 차이를 보였습니다.

FedOpt는 극심한 변동성을 보인다는 점에 주목할 필요가 있습니다. ResNet-34에서는 매우 저조한 성능(균형 정확도 0.3638)을 보이는 반면, DINOv2-S에서는 경쟁력 있는 성능(균형 정확도 0.5594)을 유지합니다.이에 비해 FedAvg와 FedProx는 두 모델 모두에서 비교적 안정적인 성능을 보였습니다.FedMedian은 두 아키텍처 모두에서 가장 일관된 성능을 보였으며, ResNet-34에서 0.5738, DINOv2-S에서 0.5797의 균형 정확도를 달성했습니다.
연구 결과는 연합 학습이 성능을 크게 향상시키며, 단일 기관의 데이터만을 사용하여 학습한 모델에 비해 데이터 공유 없이 협업 학습을 수행하는 것이 더 유리함을 보여준다는 것을 입증합니다(58% 대 52%, 균형 정확도). 연합 모델은 모든 데이터를 중앙에서 학습한 모델보다 성능이 약간 떨어지지만, 데이터 개인정보 보호를 완벽하게 유지하면서도 유사한 정확도를 달성합니다.
② 외부에서 배포된 데이터의 일반화 평가
바르셀로나의 Client 3 외부 검증 데이터셋에 대한 평가 결과, 아래 표에서 볼 수 있듯이 두 가지 연합 학습 방식(FedMedian 및 FedOpt) 모두 완전히 새로운 기관 데이터에서 중앙 집중식 학습 방식보다 우수한 성능을 보였습니다(균형 정확도 67% 대 64%). 이는 다음과 같은 점을 시사합니다...연합 훈련 과정에서 이질적인 기관적 특징(예: 영상 장비, 환자 집단, 염색 방법)에 노출되면 모델이 보다 일반화 가능한 형태학적 특징을 학습하는 데 도움이 됩니다.

FedMedian은 특히 소수의 세포 유형에서 유의미한 개선을 보였습니다. 밴드 호중구 F1: 0.62 대 중심 호중구 0.30 (TP3T 1071 증가), 그리고 전골수구 F1: 0.61 대 중심 호중구 0.35 (TP3T 741 증가)입니다.연구 결과는 서로 다른 기관 프로토콜 하에서도 진단적 특징이 효과적으로 보존되었음을 보여줍니다.그러나 모든 방법에서 골수세포 식별은 여전히 어려운 과제이며(F1: 0.02–0.30), 이는 극히 드문 클래스로부터 견고한 표현을 학습하는 데 근본적인 어려움이 있음을 반영합니다.
③ 아키텍처와 집계 전략 간의 상호작용 법칙
연구진은 또한 주요 아키텍처-집계 전략 상호작용을 다음과 같이 확인했습니다. FedMedian은 아키텍처 간 견고성을 제공하지만 희귀 클래스에는 불리합니다. FedOpt는 소수 클래스에서 셀 신호 충실도를 유지하는 데 더 나은 성능을 보이지만 아키텍처에 민감합니다. DINOv2-S의 사전 학습된 Transformer 아키텍처는 비IID 데이터 분포에 대해 더 높은 견고성을 보이는 반면, ResNet-34는 기울기 충돌에 더 민감합니다.
종합적으로, 이러한 연구 결과는 연합 학습이 혈액학적 영상 분석을 위한 견고하고, 개인정보 보호 기능이 뛰어나며, 일반화 가능한 프레임워크임을 보여줍니다.
연합 학습은 의료 데이터 사일로를 허무는 데 핵심적인 역할을 합니다.
연합 학습은 분산 데이터 환경을 위한 협업 머신 러닝 패러다임입니다. 핵심 개념은 원본 데이터를 중앙 집중화하지 않고 모델을 공동으로 학습하는 것입니다. 연합 학습 프레임워크에서 참여 기관(병원, 연구소, 연구 센터 등)은 각자 로컬에서 모델을 학습하고, 모델 매개변수 또는 기울기 업데이트만 중앙 서버에 업로드합니다. 서버는 이러한 업데이트를 취합하여 전역 모델을 생성하고, 각 노드에 배포하여 반복적인 학습을 진행합니다. "데이터는 각자의 영역 내에 유지되고 모델은 협업한다"는 이러한 메커니즘을 통해,연합 학습은 기관 간 지식 공유를 가능하게 하는 동시에 데이터 개인정보를 효과적으로 보호하고 엄격한 데이터 규정 준수 요건을 충족합니다.
지난 몇 년간 많은 조직들이 연합 학습을 통해 의료 산업을 강화하는 방안을 모색해 왔습니다. 대표적인 예로, 엔드투엔드 AI 생명공학 기업인 오킨(Owkin)은 프랑스에서 주목할 만한 AI 스타트업 20곳 중 하나, 2023년 가장 주목할 만한 의료 및 기술 스타트업 중 하나, 최고의 의료 기술상, 그리고 포브스 AI 50에 선정되는 등 여러 차례 인정을 받았습니다.
오킨은 AI 기술을 활용하여 다양한 환자 데이터에서 여러 생체 지표를 식별하고, 환자를 하위 그룹으로 분류하고, 각 환자에게 가장 적합한 치료 목표를 설정하고, 표적 약물 개발을 촉진하고, 질병 진단 도구를 최적화하고, 진정한 맞춤형 의학을 실현하는 데 주력하고 있습니다.위의 목표를 달성하는 핵심은 환자 데이터의 개인 정보 보호를 보장하면서 데이터를 공유하는 방법에 있습니다.이 문제를 해결하기 위해 Owkin은 연합 학습(federated learning) 기술을 활용합니다. 이 기술의 도입을 촉진하기 위해 Owkin은 연합 학습 소프트웨어인 Substra를 오픈 소스로 공개했으며, 이 소프트웨어는 임상 연구, 신약 개발 및 기타 응용 분야에서 사용할 수 있습니다.
오픈소스 주소:
의료 영상 분야에서 연합 학습은 '데이터 사일로'와 개인정보 보호 규정 준수 문제를 극복하는 핵심적인 기술적 접근 방식으로 여겨집니다. 의료 영상 데이터는 환자의 개인정보 보호 및 GDPR, HIPAA와 같은 엄격한 규정을 수반하는 매우 민감한 정보입니다. 기존의 중앙 집중식 학습 방식은 윤리 승인, 법적 위험, 국경 간 데이터 전송 제한과 같은 현실적인 어려움에 직면하는 경우가 많습니다. 연합 학습을 통해 여러 병원이 원시 영상 데이터를 공유하지 않고도 모델을 공동으로 학습시킬 수 있으므로, 다양한 장비, 염색 프로토콜, 환자 집단에 걸쳐 모델의 일반화 능력을 향상시킬 수 있습니다.기존 연구에 따르면 연합 학습은 방사선 영상, 디지털 병리학, 초음파 영상과 같은 분야에서 중앙 집중식 훈련과 유사하거나 심지어 능가하는 기관 간 일반화 성능을 달성할 수 있는 것으로 나타났습니다.특히 외부 데이터 테스트에서 더욱 강력한 안정성을 보여줍니다.
더 넓은 관점에서 볼 때, 연합 학습으로 대표되는 "분산 협업 지능" 모델은 미래 의료 AI의 대규모 배포를 위한 핵심 인프라가 되고 있습니다. 이는 개인정보 보호를 준수하는 대규모 의료 모델 학습을 위한 실현 가능한 경로를 제공할 뿐만 아니라, 기관 간 임상 의사결정 지원 시스템과 글로벌 협업 의료 연구 플랫폼을 위한 기술적 기반을 마련합니다. 혈액 형태 분석과 같은 특정 분야에서 연합 학습은 AI를 단일 기관 실험실 응용 분야에서 지역 및 시스템 간 협업이 가능한 임상 수준의 지능형 진단 서비스로 발전시켜 정밀 의학과 디지털 헬스케어에 핵심적인 지원을 제공할 것으로 기대됩니다.
참고문헌:
1.https://arxiv.org/abs/2601.04121
2.https://mp.weixin.qq.com/s/Lf6N7EUHlhibLNc9YXWjTQ








