DoubleU-Net: 의료 이미지 분할을 위한 깊은 합성곱 신경망

세마틱 이미지 분할은 이미지의 각 픽셀을 해당 클래스로 라벨링하는 과정입니다. U-Net 및 그 변형과 같은 인코더-디코더 기반 접근 방식은 의료 이미지 분할 작업을 해결하기 위한 인기 있는 전략입니다. 다양한 분할 작업에서 U-Net의 성능을 개선하기 위해, 두 개의 U-Net 아키텍처를 쌓아서 구성한 새로운 구조인 DoubleU-Net을 제안합니다. 첫 번째 U-Net은 이미 ImageNet에서 특징을 학습하여 다른 작업으로 쉽게 전이될 수 있는 사전 훈련된 VGG-19를 인코더로 사용합니다. 더 많은 세마틱 정보를 효율적으로 포착하기 위해, 아래에 또 다른 U-Net을 추가했습니다. 또한 네트워크 내에서 문맥 정보를 포착하기 위해 Atrous Spatial Pyramid Pooling (ASPP)을 채택했습니다.DoubleU-Net의 성능을 평가하기 위해, 콜론스코피, 피부내시경, 현미경 등 다양한 영상 모달리티를 포함하는 네 가지 의료 분할 데이터셋을 사용했습니다. MICCAI 2015 분할 도전, CVC-ClinicDB, 2018 데이터 사이언스 볼 도전, 그리고 병변 경계 분할 데이터셋에서 수행된 실험들은 DoubleU-Net이 U-Net 및 베이스라인 모델보다 우수한 성능을 보임을 입증합니다. 특히 CVC-ClinicDB와 MICCAI 2015 분할 도전 데이터셋에서 더 정확한 분할 마스크를 생성하며, 이는 작은 평평한 폴립과 같은 어려운 이미지를 포함하고 있습니다. 이러한 결과는 기존 U-Net 모델에 비해 개선되었음을 보여줍니다.다양한 의료 이미지 분할 데이터셋에서 얻은 긍정적인 결과는 DoubleU-Net이 의료 이미지 분할뿐만 아니라 크로스 데이터셋 평가 테스트에서도 강력한 베이스라인으로 활용될 수 있음을 시사합니다. 이를 통해 딥러닝(DL) 모델의 일반화 능력을 측정할 수 있습니다.