UNet 3+: 의료 영상 세그멘테이션을 위한 전체 규모 연결 UNet

최근 들어 딥러닝 기반의 의미 분할(semantic segmentation)에 대한 관심이 증가하고 있다. 인코더-디코더 아키텍처를 채택한 딥러닝 네트워크 중 하나인 UNet은 의료 영상 분할 분야에서 널리 사용되고 있다. 정확한 분할을 위해 다중 스케일 특징을 통합하는 것은 중요한 요소 중 하나이다. UNet++는 중첩 및 밀집(skip) 연결을 갖춘 아키텍처를 설계함으로써 기존 UNet을 개선한 변형 모델이다. 그러나 기존 방법은 전체 스케일에서 충분한 정보를 탐색하지 못하며, 여전히 개선의 여지가 크다. 본 논문에서는 전체 스케일의 스킵 연결과 심층적 감독(deep supervision)을 활용하는 새로운 UNet 3+를 제안한다. 전체 스케일 스킵 연결은 서로 다른 스케일의 특징 맵에서 저수준의 세부 정보와 고수준의 의미 정보를 통합하며, 심층적 감독은 전체 스케일의 특징 맵을 통합한 후 계층적인 표현을 학습한다. 제안된 방법은 다양한 크기로 나타나는 장기의 분할에 특히 유리하다. 정확도 향상 외에도, 제안된 UNet 3+는 네트워크 파라미터를 줄여 계산 효율성을 향상시킬 수 있다. 또한, 하이브리드 손실 함수(hybrid loss function)를 제안하고, 분류 지도(classification-guided) 모듈을 도입하여 비장기 영역에서의 장기 경계를 강화하고 과도한 분할(over-segmentation)을 감소시켜 더 정확한 분할 결과를 도출한다. 제안된 방법의 효과는 두 가지 데이터셋을 통해 검증되었다. 코드는 다음 링크에서 공개되어 있다: github.com/ZJUGiveLab/UNet-Version