2달 전

MobileUNETR: 효율적인 의료 이미지 분할을 위한 경량화된 엔드투엔드 하이브리드 비전 트랜스포머

Shehan Perera; Yunus Erzurumlu; Deepak Gulati; Alper Yilmaz
MobileUNETR: 효율적인 의료 이미지 분할을 위한 경량화된 엔드투엔드 하이브리드 비전 트랜스포머
초록

피부암 분할은 의료 이미지 분석에서 중요한 도전 과제를 제시합니다. 기존의 많은 솔루션, 특히 CNN(합성곱 신경망) 기반 방법들은 전역적 맥락 이해 부족 문제에 직면해 있습니다. 대안적으로, 일부 접근 방식은 전역적 맥락 간극을 메우기 위해 대규모 트랜스포머 모델을 사용하지만, 이는 모델 크기와 계산 복잡도 증가를 초래합니다. 또한 많은 트랜스포머 기반 접근 방식들이 디코더 단계에서 CNN 기반 디코더에 크게 의존하여 트랜스포머 기반 디코딩 모델의 장점을 간과하고 있습니다. 이러한 한계를 인식하고, 우리는 CNN과 트랜스포머의 성능 제약을 극복하면서 모델 크기를 최소화하는 효율적인 경량 솔루션의 필요성을 다루기 위해 MobileUNETR을 소개합니다. MobileUNETR은 효율적인 이미지 분할을 향한 유망한 발전으로 자리 잡고 있습니다.MobileUNETR은 3가지 주요 특징을 가지고 있습니다.1) MobileUNETR은 경량 하이브리드 CNN-트랜스포머 인코더로 구성되어 있어 로컬 및 전역적 맥락 특징 추출을 효율적으로 균형 있게 수행합니다.2) 새로운 하이브리드 디코더는 디코딩 단계에서 다양한 해상도에서 저수준 및 전역 특징을 동시에 활용하여 정확한 마스크 생성을 가능하게 합니다.3) 대규모 복잡한 아키텍처를 능가하며, MobileUNETR은 3백만 개의 매개변수와 1.3 GFLOP(초당 13억 회 부동소수점 연산)의 계산 복잡도로 10배와 23배 각각 매개변수와 FLOPS(초당 부동소수점 연산 수)를 줄였습니다.우리는 네 가지 공개된 피부 병변 분할 데이터셋인 ISIC 2016, ISIC 2017, ISIC 2018, 그리고 PH2 데이터셋에서 광범위한 실험을 수행하여 제안된 방법의 유효성을 검증했습니다. 코드는 다음과 같이 공개될 예정입니다: https://github.com/OSUPCVLab/MobileUNETR.git

MobileUNETR: 효율적인 의료 이미지 분할을 위한 경량화된 엔드투엔드 하이브리드 비전 트랜스포머 | 최신 연구 논문 | HyperAI초신경