3달 전

CNN을 활용한 계층적 질병 종속성과 불확실성 레이블을 고려한 흉부 X선 해석

Hieu H. Pham, Tung T. Le, Dat Q. Tran, Dat T. Ngo, Ha Q. Nguyen
CNN을 활용한 계층적 질병 종속성과 불확실성 레이블을 고려한 흉부 X선 해석
초록

흉부 방사선 촬영은 다양한 흉부 질환의 스크리닝 및 진단에 있어 가장 흔한 진단 방사선 검사 중 하나로, 매우 중요한 역할을 한다. 특정 병변, 예를 들어 폐 결절이나 폐암 등을 탐지하기 위해 전문적인 알고리즘이 개발되어 왔다. 그러나 흉부 X선 사진(CXR)에서 여러 질환의 존재를 정확하게 탐지하는 것은 여전히 도전적인 과제이다. 본 논문은 깊이 있는 합성 신경망(CNN) 기반의 지도 학습 다중 레이블 분류 프레임워크를 제안하여, 14가지 흔한 흉부 질환의 위험도를 예측한다. 이 문제를 해결하기 위해, 병변 레이블 간의 종속성을 효과적으로 활용하는 최신 기술의 CNN을 훈련시켰으며, 거의 모든 CXR 데이터셋에서 상당한 비중을 차지하는 불확실한 샘플들을 더 잘 다루기 위해 레이블 스무딩 기법을 도입하였다. 제안된 모델은 최근 공개된 CheXpert 데이터셋의 20만 건 이상의 CXR 이미지로 훈련되었으며, 검증 세트에서 5가지 선택된 병변을 예측할 때 평균 AUC(곡선 아래 면적)가 0.940을 기록하여, 지금까지 보고된 최고 수준의 AUC 성능을 달성하였다. 또한 본 방법은 CheXpert 경진대회에서 독립된 테스트 세트(5명의 경험이 풍부한 방사선 전문의가 공동으로 주석한 500건의 CXR 연구)를 통해 평가되었으며, 평균 AUC가 0.930으로, 3명의 개별 방사선 전문의 중 2.6명 이상의 성능을 초과하는 결과를 보였으며, 이는 본 논문 작성 시점에서 CheXpert 리더보드에서 1위에 해당한다.