11일 전

폐 건강 분야의 AI: 다양한 CT 스캔 데이터셋을 통한 탐지 및 진단 모델의 기준 설정

Tushar, Fakrul Islam, Wang, Avivah, Dahal, Lavsen, Harowicz, Michael R., Lafata, Kyle J., Tailor, Tina D., Lo, Joseph Y.
폐 건강 분야의 AI: 다양한 CT 스캔 데이터셋을 통한 탐지 및 진단 모델의 기준 설정
초록

폐암은 전 세계적으로 암으로 인한 사망의 주요 원인으로 남아 있으며, 저선량 컴퓨터 단층촬영(LDCT)을 통한 조기 검출이 사망률 감소에 상당한 잠재력을 보여주고 있다. 의료 영상 분야에 인공지능(AI)이 점차 통합되면서 강력한 AI 모델의 개발 및 평가를 위해서는 대규모이고 정밀하게 주석화된 데이터셋에 접근할 필요가 있다. 본 연구에서는 2,000건 이상의 촬영 데이터와 3,000개 이상의 전문가 검증을 거친 결절을 보유한, 세계에서 가장 규모가 큰 공개용 LDCT 데이터셋인 Duke 폐암 선별(DLCS) 데이터셋의 활용 가능성을 제시한다. 우리는 LUNA16, LUNA25, NLST-3D+를 포함한 내부 및 외부 데이터셋을 대상으로 3D 결절 탐지 및 폐암 분류를 위한 딥러닝 모델을 벤치마킹하였다. 결절 탐지에 대해, MONAI 기반의 RetinaNet 모델 두 개(DLCSDmD 및 LUNA16-mD)를 개발하였으며, 경쟁 성능 지표(CPM)를 사용하여 평가하였다. 분류에 있어서는 최신 기술 기반의 사전 훈련 모델(Models Genesis, Med3D), 자기지도 학습 기반 기초 모델(FMCB), 무작위 초기화된 ResNet50, 그리고 본 연구에서 제안한 새로운 전략적 웜스타트++(SWS++) 모델 총 다섯 가지를 비교하였다. SWS++ 모델은 동일한 탐지 파이프라인 내에서 정제된 후보 패치를 활용하여 분류 백본을 사전 훈련함으로써, 작업에 적합한 특징 학습을 가능하게 한다. 제안된 모델들은 다양한 데이터셋에서 뛰어난 일반화 성능을 보였으며, SWS++는 여러 데이터셋에서 기존 기초 모델과 비교해 유사하거나 더 우수한 성능을 기록하였다(AUC: 0.71~0.90). 본 연구에서 개발한 모든 코드, 모델, 데이터는 공개되어 재현성과 협업을 촉진할 수 있도록 제공된다. 본 연구는 폐암 AI 연구를 위한 표준화된 벤치마킹 자원을 구축함으로써, 향후 모델 개발, 검증 및 임상 적용을 위한 기반을 마련한다.

폐 건강 분야의 AI: 다양한 CT 스캔 데이터셋을 통한 탐지 및 진단 모델의 기준 설정 | 최신 연구 논문 | HyperAI초신경