의료 이미지 분할을 위한 압축 및 확장 트랜스포머 사용

의료 이미지 분할은 컴퓨터 지원 진단에서 중요한 역할을 합니다. 우수한 분할은 모델이 전반적인 그림과 세부 사항을 동시에 인식하도록 요구하며, 즉 큰 컨텍스트를 통합하면서도 높은 공간 해상도를 유지하는 이미지 특성을 학습하도록 합니다. 이 목표에 접근하기 위해 가장 널리 사용되는 방법인 U-Net 및 변형체들은 다중 스케일 특성을 추출하고 융합합니다. 그러나 융합된 특성들은 여전히 "효과적 수용 영역"이 작고 국소 이미지 큐에 집중되어 있어 성능에 제약을 주는 문제점이 있습니다. 본 연구에서는 이러한 한계를 극복하기 위해 트랜스포머 기반의 대안적인 분할 프레임워크인 Segtran을 제안합니다. Segtran의 핵심은 새로운 Squeeze-and-Expansion 트랜스포머입니다: 압축된 어텐션 블록은 트랜스포머의 자기 어텐션을 규제하고, 확장 블록은 다양화된 표현을 학습합니다. 또한, 우리는 이미지를 위한 연속성 유도 편향을 부여하는 트랜스포머의 새로운 위치 인코딩 방식을 제안합니다. 2차원 및 3차원 의료 이미지 분할 작업에서 실험을 수행했습니다: 안저 사진에서 시디스크/컵 분할(REFUGE'20 챌린지), 대장내시경 사진에서 폴립 분할, 그리고 MRI 스캔에서 뇌 종양 분할(BraTS'19 챌린지)입니다. 기존의 대표적인 방법들과 비교하여 Segtran은 일관되게 가장 높은 분할 정확도를 달성하였으며, 좋은 크로스 도메인 일반화 능력을 보였습니다. Segtran의 소스 코드는 https://github.com/askerlee/segtran 에서 제공됩니다.