17일 전

ParaTransCNN: 의료 영상 세그멘테이션을 위한 병렬화된 TransCNN 인코더

Hongkun Sun, Jing Xu, Yuping Duan
ParaTransCNN: 의료 영상 세그멘테이션을 위한 병렬화된 TransCNN 인코더
초록

의료 영상 분할 분야에서 컨볼루션 신경망 기반 방법은 뛰어난 성능으로 인해 점점 더 인기를 끌고 있다. 그러나 이러한 방법은 전역적인 맥락적 상관관계를 정확히 모델링하는 데 필수적인 장거리 의존성(long-range dependencies)을 포착하는 데 어려움을 겪는다. 이에 비해 트랜스포머 기반 방법은 수용 영역을 확장함으로써 장거리 의존성을 효과적으로 모델링할 수 있는 능력을 지니고 있어 주목받고 있다. 이러한 점에 착안하여, 컨볼루션 신경망과 트랜스포머 아키텍처를 결합한 고급 2차원 특징 추출 방법을 제안한다. 구체적으로, 병렬 인코더 구조를 도입하여, 한 가지 브랜치는 ResNet을 활용해 이미지의 국소 정보를 추출하고, 다른 브랜치는 트랜스포머를 사용해 전역 정보를 추출하도록 설계하였다. 또한, 특히 집중적인 예측 작업에서 다양한 해상도에서 전역 정보를 추출하기 위해 트랜스포머에 피라미드 구조를 통합하였다. 병렬 인코더에서 얻은 서로 다른 정보를 디코더 단계에서 효율적으로 활용하기 위해 채널 주의 모듈(channel attention module)을 도입하여 인코더의 특징을 융합하고, 스케이프 연결(skip connections)과 보틀넥(bottlenecks)을 통해 전파하였다. 대동맥 혈관 트리, 심장, 다기관 데이터셋을 대상으로 집중적인 수치 실험을 수행하였으며, 최첨단 의료 영상 분할 방법들과 비교한 결과, 특히 소형 기관에 대해 더 높은 분할 정확도를 보임을 입증하였다. 코드는 공개적으로 https://github.com/HongkunSun/ParaTransCNN 에서 제공된다.

ParaTransCNN: 의료 영상 세그멘테이션을 위한 병렬화된 TransCNN 인코더 | 최신 연구 논문 | HyperAI초신경