2일 전
Raptor: 3D 의료 볼륨을 위한 확장 가능한 무학습 임베딩 - 사전 학습된 2D 기반 모델 활용
Ulzee An, Moonseong Jeong, Simon Austin Lee, Aditya Gorla, Yuzhe Yang, Sriram Sankararaman

초록
현재 자기 공명 영상(MRI)과 같은 부피 영상 데이터를 위한 기초 모델 개발의 주요 과제는 고차원에서 최신 아키텍처의 계산 복잡성과 충분히 큰 부피 데이터셋을 구축하는 데 있습니다. 이러한 과제를 해결하기 위해, 우리는 Raptor (Random Planar Tensor Reduction, 무작위 평면 텐서 축소)라는 학습이 필요 없는 방법을 소개합니다. Raptor는 자연 이미지에 사전 학습된 동결된 2D 기초 모델을 활용하여 의료 부피의 개별 단면에서 시각적 토큰을 추출합니다. 이 토큰들은 무작위 투사(random projections)를 통해 공간적으로 압축되어, 계산 복잡성을 크게 줄이면서도 풍부한 의미 정보를 유지합니다. 10개의 다양한 의료 부피 작업에 대한 광범위한 실험 결과는 Raptor가 의료 부피 전용으로 사전 학습된 최신 방법들을 포함하여 모든 최신 방법들(SuPreM +3, MISFM +6, Merlin +10, VoCo +13, SLIViT +14)보다 우수한 성능을 보임을 확인해주며, 비용이 많이 드는 학습 과정을 완전히 생략할 수 있음을 입증합니다. 우리의 결과는 Raptor가 의료 부피에 대한 딥러닝 기반 방법론 발전의 기초로서 효과적이고 다목적임을 강조합니다(코드: github.com/sriramlab/raptor).