17일 전

TransFuse: 의료 영상 분할을 위한 트랜스포머와 CNN의 융합

Yundong Zhang, Huiye Liu, Qiang Hu
TransFuse: 의료 영상 분할을 위한 트랜스포머와 CNN의 융합
초록

의료 영상 세그멘테이션은 다양한 임상적 요구사항의 전제 조건이 되며, 최근 컨볼루션 신경망(CNN)의 발전으로 크게 발전해왔다. 그러나 기존 방법들은 명시적인 장거리 관계를 모델링하는 데 있어 일반적인 한계를 보이고 있으며, 깊은 인코더를 구축하고 극도로 강한 다운샘플링 연산을 사용하는 기존 해결책은 중복된 깊은 네트워크 구조를 초래하고 국소적 세부 정보의 손실을 야기한다. 따라서 세그멘테이션 작업은 글로벌 맥락을 효율적으로 모델링하면서도 저수준 세부 정보를 강력하게 유지할 수 있는 더 나은 해결책을 절실히 필요로 한다. 본 논문에서는 이러한 도전 과제를 해결하기 위해, 병렬형 브랜치 아키텍처인 TransFuse를 제안한다. TransFuse는 Transformer와 CNN을 병렬 구조로 결합함으로써, 훨씬 얕은 네트워크로도 전역적 종속성과 저수준 공간적 세부 정보를 효율적으로 포착할 수 있다. 또한, 두 브랜치로부터 얻은 다중 수준 특징을 효율적으로 융합하기 위한 새로운 융합 기법인 BiFusion 모듈을 도입하였다. 광범위한 실험을 통해 TransFuse가 폴립, 피부 병변, 대퇴골, 전립선 세그멘테이션을 포함한 2D 및 3D 의료 영상 데이터셋에서 최신의 최상 성능을 달성함과 동시에 파라미터 수를 크게 감소시키고 추론 속도를 크게 향상시킴을 입증하였다.

TransFuse: 의료 영상 분할을 위한 트랜스포머와 CNN의 융합 | 최신 연구 논문 | HyperAI초신경