
컨벌루션 신경망(CNNs)이 의료 이미지 분할에서 진보를 이끌고 있지만, 표준 모델들은 여전히 몇 가지 단점이 있습니다. 첫째, 다중 스케일 접근 방식, 즉 인코더-디코더 아키텍처의 사용은 유사한 저수준 특징들이 여러 스케일에서 여러 번 추출되는 정보의 중복 사용을 초래합니다. 둘째, 장거리 특징 의존성이 효율적으로 모델링되지 않아 각 의미 클래스와 관련된 최적의 구분력 있는 특징 표현이 생성되지 않습니다. 본 논문에서는 이러한 제한점을 극복하기 위해 안내된 자기 주의 메커니즘을 활용하여 더 풍부한 문맥 의존성을 포착하는 제안된 아키텍처를 통해 시도하고 있습니다. 이 접근 방식은 로컬 특징들을 그에 해당하는 글로벌 의존성과 통합하며, 또한 채널 맵 간의 상호 의존성을 적응적으로 강조할 수 있습니다. 또한, 다른 모듈들 사이의 추가적인 손실은 주의 메커니즘이 무관한 정보를 무시하고 이미지의 더 구분력 있는 영역에 집중하도록 유도하여 관련 특징 연관성을 강조합니다. 우리는 제안된 모델을 세 가지 다른 데이터셋(복부 기관, 심혈관 구조 및 뇌 종양)에서 의미 분할의 맥락에서 평가하였습니다. 일련의 축소 실험(ablation experiments)은 제안된 아키텍처에서 이러한 주의 모듈들의 중요성을 뒷받침합니다. 또한, 다른 최신 분할 네트워크들과 비교하여 우리의 모델은 예측 정확도를 높이면서 표준 편차를 줄이는 더 나은 분할 성능을 보입니다. 이는 우리의 접근 방식이 정밀하고 신뢰성 있는 자동 의료 이미지 분할을 생성하는 효율성을 입증합니다. 우리의 코드는 https://github.com/sinAshish/Multi-Scale-Attention 에 공개되어 있습니다.