4달 전

LM-Net: 의료 이미지 세그멘테이션을 위한 경량화 및 다중 스케일 네트워크

Zhenkun Lu; Chaoyin She; Wei Wang; Qinghua Huang
LM-Net: 의료 이미지 세그멘테이션을 위한 경량화 및 다중 스케일 네트워크
초록

현재 의료 이미지 분할 방법에는 다중 스케일 정보를 깊이 있게 탐색하고, 로컬 세부 텍스처와 글로벌 문맥적 의미 정보를 효과적으로 결합하는 데 한계가 있습니다. 이로 인해 과분할, 부족한 분할, 그리고 모호한 분할 경계 문제가 발생합니다. 이러한 문제를 해결하기 위해, 우리는 다양한 관점에서 다중 스케일 특징 표현을 탐구하여 새로운, 가벼운, 그리고 다중 스케일 아키텍처(LM-Net)를 제안합니다. 이 아키텍처는 Convolutional Neural Networks(CNNs)와 Vision Transformers(ViTs)의 장점을 통합하여 분할 정확도를 향상시키는 것을 목표로 합니다. LM-Net은 동일한 수준에서 다중 스케일 특징을 포착하기 위해 가벼운 다중 브랜치 모듈을 사용합니다. 또한, 다른 수준에서 로컬 세부 텍스처와 글로벌 문맥적 의미 정보를 동시에 포착하기 위해 두 가지 모듈을 도입하였습니다: Local Feature Transformer(LFT)와 Global Feature Transformer(GFT). LFT는 로컬 윈도우 자기 주의 메커니즘을 통합하여 로컬 세부 텍스처를 포착하며, GFT는 글로벌 자기 주의 메커니즘을 활용하여 글로벌 문맥적 의미 정보를 포착합니다. 이러한 모듈들을 결합함으로써 우리의 모델은 로컬과 글로벌 표현 간의 보완성을 달성하며, 의료 이미지 분할에서 모호한 분할 경계 문제를 완화시킵니다. LM-Net의 타당성을 평가하기 위해, 다양한 모달리티를 가진 세 개의 공개 데이터셋에서 광범위한 실험을 수행하였습니다. 제안된 모델은 4.66G FLOPs와 5.4M 파라미터만 필요로 하면서 기존 방법들을 능가하는 최신 결과를 달성하였습니다. 이러한 최신 결과들은 다양한 모달리티를 가진 세 개의 데이터셋에서 LM-Net의 효율성과 적응력을 입증해주고 있습니다.