17일 전

의료 영상 세그멘테이션을 위한 이중 크로스 어텐션

Gorkem Can Ates, Prasoon Mohan, Emrah Celik
의료 영상 세그멘테이션을 위한 이중 크로스 어텐션
초록

우리는 의료 영상 분할을 위한 U-Net 기반 아키텍처에서 스위프 커넥션(skip-connection)을 강화할 수 있는 간단하면서도 효과적인 어텐션 모듈인 이중 크로스 어텐션(Dual Cross-Attention, DCA)을 제안한다. DCA는 다중 스케일 인코더 특징 간의 채널과 공간적 종속성을 순차적으로 캡처함으로써 인코더와 디코더 특징 간의 의미적 갭(sematic gap)을 해결한다. 먼저, 채널 크로스 어텐션(Channel Cross-Attention, CCA)은 다중 스케일 인코더 특징의 채널 토큰 간의 크로스 어텐션을 활용하여 전역적인 채널별 종속성을 추출한다. 다음으로, 공간 크로스 어텐션(Spatial Cross-Attention, SCA) 모듈은 공간 토큰 간의 크로스 어텐션을 수행하여 공간적 종속성을 포착한다. 마지막으로, 이러한 세부적인 인코더 특징은 업샘플링되어 해당 디코더 부분과 연결되어 스위프 커넥션 구조를 형성한다. 제안하는 DCA 모듈은 U-Net 및 그 변종과 같은 모든 스위프 커넥션을 갖춘 인코더-디코더 아키텍처에 쉽게 통합할 수 있다. 본 연구에서는 U-Net, V-Net, R2Unet, ResUnet++, DoubleUnet, MultiResUnet 등 6가지 U-Net 기반 아키텍처에 DCA 모듈을 통합하여 실험을 수행하였다. 그 결과, GlaS 데이터셋에서 최대 2.05%, MoNuSeg에서 2.74%, CVC-ClinicDB에서 1.37%, Kvasir-Seg에서 1.12%, Synapse 데이터셋에서 1.44%의 Dice 스코어 향상이 관측되었다. 본 연구의 코드는 다음 링크에서 공개되어 있다: https://github.com/gorkemcanates/Dual-Cross-Attention

의료 영상 세그멘테이션을 위한 이중 크로스 어텐션 | 최신 연구 논문 | HyperAI초신경