17일 전
EMCAD: 의료 영상 세그멘테이션을 위한 효율적인 다중 스케일 컨볼루션 어텐션 디코딩
Md Mostafijur Rahman, Mustafa Munir, Radu Marculescu

초록
의료 영상 분할에서 효율적이고 효과적인 디코딩 메커니즘은 특히 계산 자원이 제한된 환경에서 매우 중요하다. 그러나 이러한 디코딩 메커니즘은 일반적으로 높은 계산 비용을 수반한다. 이 문제를 해결하기 위해, 성능과 계산 효율성을 동시에 최적화할 수 있도록 설계된 새로운 효율적인 다중 스케일 컨볼루션 주의 메커니즘 디코더인 EMCAD를 제안한다. EMCAD는 고유한 다중 스케일 딥웨이즈 컨볼루션 블록을 활용하여 다중 스케일 컨볼루션을 통해 특징 맵을 크게 향상시킨다. 또한 채널, 공간, 그리고 그룹화된(대형 커널) 게이트 주의 메커니즘을 도입하여 복잡한 공간적 관계를 효과적으로 포착하면서도 주목할 만한 영역에 집중할 수 있다. 그룹 컨볼루션과 딥웨이즈 컨볼루션을 활용함으로써 EMCAD는 매우 효율적이며 우수한 확장성을 가지며(표준 인코더를 사용할 경우 단 191만 개의 파라미터와 0.381G FLOPs만 필요), 실용적인 적용이 가능하다. 6개의 의료 영상 분할 작업에 속하는 12개의 데이터셋을 대상으로 수행한 철저한 평가 결과, EMCAD는 파라미터 수와 FLOPs에서 각각 79.4%, 80.3% 감소를 달성하며 최신 기준(SOTA) 성능을 기록하였다. 더불어 EMCAD는 다양한 인코더에 대한 적응성과 다양한 분할 작업에서의 유연성 덕분에, 효율적이고 정확한 의료 영상 분석을 위한 전망 있는 도구로 자리매김하고 있다. 본 연구의 구현 코드는 https://github.com/SLDGroup/EMCAD 에서 공개되어 있다.