DCSAU-Net: 의료 영상 분할을 위한 더 깊고 더 컴팩트한 스플릿 어텐션 U-Net

심층 학습 아키텍처 중 컨볼루션 신경망(Convolutional Neural Network, CNN)은 컴퓨터 비전 분야에서 뛰어난 성과를 거두었다. 특히 CNN 기반의 인코더-디코더 구조를 가진 U-Net은 생물의학 이미지 세그멘테이션 분야에서 획기적인 성과를 내며 다양한 실용적 응용 사례에 활용되고 있다. 그러나 기존 U-Net은 인코더 부분의 모든 다운샘플링 레이어를 동일하게 설계하고 단순히 컨볼루션 층을 쌓는 방식을 취함으로써, 다양한 깊이에서의 특징 정보를 충분히 추출하지 못하는 한계를 가지고 있다. 의료 이미지의 복잡성 증가로 인해 기존 방법들은 새로운 도전에 직면하고 있다. 본 논문에서는 두 가지 새로운 프레임워크인 ‘기본 특징 보존(Primary Feature Conservation)’과 ‘콤팩트 스플릿 어텐션 블록(Compact Split-Attention Block)’을 기반으로, 저수준과 고수준의 의미 정보를 효율적으로 활용하는 더 깊고 더 컴팩트한 스플릿 어텐션 U-모양 네트워크(DCSAU-Net)를 제안한다. 제안한 모델은 CVC-ClinicDB, 2018 Data Science Bowl, ISIC-2018, SegPC-2021 등의 데이터셋에서 평가되었으며, 평균 교차율(mIoU)과 F1 스코어 측면에서 기존 최고 수준(SOTA)의 방법들보다 우수한 성능을 보였다. 특히, 도전적인 이미지에 대해서도 뛰어난 세그멘테이션 성능을 입증하였다. 본 연구의 코드 및 추가 기술적 세부사항은 https://github.com/xq141839/DCSAU-Net에서 확인할 수 있다.