2달 전

UCTransNet: U-Net의 스킵 연결을 채널별 관점에서 재고찰하기 - 트랜스포머를 활용한 접근법

Haonan Wang; Peng Cao; Jiaqi Wang; Osmar R. Zaiane
UCTransNet: U-Net의 스킵 연결을 채널별 관점에서 재고찰하기 - 트랜스포머를 활용한 접근법
초록

최근의 의미 분할 방법들은 인코더-디코더 구조를 가진 U-Net 프레임워크를 채택하고 있습니다. 그러나 간단한 스킵 연결 방식을 사용하는 U-Net은 전역 다중 스케일 컨텍스트를 모델링하는 데 여전히 어려움이 있습니다: 1) 인코더와 디코더 단계의 불일치된 특성 집합 문제로 모든 스킵 연결 설정이 효과적이지 않으며, 일부 스킵 연결은 분할 성능에 부정적인 영향을 미칩니다; 2) 일부 데이터셋에서는 원래의 U-Net이 어떤 스킵 연결도 없는 경우보다 더 나쁜 성능을 보입니다. 이러한 결과를 바탕으로, 우리는 채널 관점에서 주의 메커니즘을 활용한 새로운 분할 프레임워크인 UCTransNet (U-Net 내에 제안된 CTrans 모듈을 포함)을 제안합니다. 특히, CTrans 모듈은 U-Net의 스킵 연결 대안으로, Transformer를 사용하여 다중 스케일 채널 크로스 융합(CCT)과 채널별 크로스-어텐션(CCA) 두 하위 모듈로 구성됩니다. 이 중 CCA는 융합된 다중 스케일 채널 정보가 디코더 특성과 효과적으로 연결되도록 안내하여 모호성을 제거하는 역할을 합니다. 따라서 제안된 CCT와 CCA로 구성된 연결은 원래의 스킵 연결을 대체하여 정확한 자동 의료 이미지 분할을 위한 의미적 간극을 해결할 수 있습니다. 실험 결과는 우리의 UCTransNet이 더 정밀한 분할 성능을 제공하며, 다양한 데이터셋과 트랜스포머 또는 U형 프레임워크를 포함하는 기존 아키텍처에서 최신 기술보다 일관되게 향상된다는 것을 시사합니다. 코드: https://github.com/McGregorWwww/UCTransNet.

UCTransNet: U-Net의 스킵 연결을 채널별 관점에서 재고찰하기 - 트랜스포머를 활용한 접근법 | 최신 연구 논문 | HyperAI초신경