17일 전
Focal-UNet: 의료 영상 분할을 위한 유사 UNet 구조의 포칼 조절
MohammadReza Naderi, MohammadHossein Givkashi, Fatemeh Piri, Nader Karimi, Shadrokh Samavi

초록
최근 들어, 트랜스포머 기반의 U자형 아키텍처를 구축하기 위한 다양한 시도가 이루어졌으며, 기존 CNN 기반 모델을 능가하는 새로운 방법들이 제안되고 있다. 그러나 트랜스포머의 패치 분할 연산으로 인해 예측 마스크에서 블록성(blockiness)과 잘린 모서리(cropped edges)와 같은 심각한 문제들이 여전히 존재한다. 본 연구에서는 새로 도입된 초점 조절 모듈(focal modulation mechanism)을 활용하여 의료 영상 세분화를 위한 새로운 U자형 아키텍처를 제안한다. 제안된 아키텍처는 인코더와 디코더의 깊이를 비대칭적으로 설계하였다. 초점 모듈이 국소적 및 전역적 특징을 효과적으로 통합할 수 있는 능력을 갖추고 있어, 본 모델은 트랜스포머의 넓은 수용장( receptive field)과 CNN의 국소적 시각화 능력을 동시에 활용할 수 있다. 이를 통해 제안된 방법은 국소적 특징과 전역적 특징의 활용을 효과적으로 균형 잡아, Swin-UNet과 같은 가장 강력한 트랜스포머 기반 U자형 모델을 능가할 수 있었다. Synapse 데이터셋에서 DICE 스코어는 1.68% 높고, HD 지표는 0.89점 우수한 성능을 기록하였다. 또한, 극도로 제한된 데이터 조건에서도 NeoPolyp 데이터셋에서 DICE 스코어가 4.25% 향상되었다. 본 연구의 구현 코드는 다음에서 공개되어 있다: https://github.com/givkashi/Focal-UNet