17일 전

MedNeXt: 의료 영상 세그멘테이션을 위한 ConvNet의 트랜스포머 기반 스케일링

Saikat Roy, Gregor Koehler, Constantin Ulrich, Michael Baumgartner, Jens Petersen, Fabian Isensee, Paul F. Jaeger, Klaus Maier-Hein
MedNeXt: 의료 영상 세그멘테이션을 위한 ConvNet의 트랜스포머 기반 스케일링
초록

의료 영상 분할 분야에서 Transformer 기반 아키텍처에 대한 관심이 급증하고 있다. 그러나 대규모 주석이 달린 의료 데이터셋이 부족하여 자연 이미지에서 달성하는 성능 수준에 도달하는 것은 여전히 도전 과제이다. 반면에, 컨볼루션 네트워크는 더 높은 인도크티브 바이어스(유도 편향)를 지니고 있어 비교적 쉽게 높은 성능을 달성할 수 있다. 최근 ConvNeXt 아키텍처는 표준 ConvNet을 현대화하기 위해 Transformer 블록의 구조를 모방하려는 시도를 했다. 본 연구에서는 이러한 접근을 개선하여 데이터 부족 상황에서의 의료 영상 분할 과제에 특화된 현대화되고 확장 가능한 컨볼루션 아키텍처를 설계하였다. 우리는 MedNeXt를 제안한다. 이는 Transformer를 영감으로 삼아 설계된 대규모 커널 기반 분할 네트워크로, 다음과 같은 핵심 기여를 포함한다: 1) 의료 영상 분할을 위한 완전한 3D ConvNeXt 인코더-디코더 네트워크, 2) 다양한 스케일 간의 의미 정보를 유지하기 위한 잔차(Residual) ConvNeXt 업샘플링 및 다운샘플링 블록, 3) 작은 커널 네트워크를 업샘플링함으로써 반복적으로 커널 크기를 증가시키는 새로운 기법을 도입하여 제한된 의료 데이터 상황에서의 성능 포화 현상을 방지, 4) MedNeXt의 깊이, 너비, 커널 크기 등 여러 수준에서의 복합 스케일링(Compound Scaling). 이러한 기법들은 CT 및 MRI 모달리티에서 4개의 다양한 작업 및 데이터셋 크기에 대해 최신 기술 수준의 성능을 달성하며, 의료 영상 분할을 위한 현대화된 딥 아키텍처의 새로운 기준을 제시한다. 본 연구의 코드는 공개되어 있으며, 다음 링크에서 확인할 수 있다: https://github.com/MIC-DKFZ/MedNeXt.

MedNeXt: 의료 영상 세그멘테이션을 위한 ConvNet의 트랜스포머 기반 스케일링 | 최신 연구 논문 | HyperAI초신경