17일 전
RaBiT: 역방향 주의 메커니즘을 갖춘 양방향 특징 피라미드 네트워크를 활용한 효율적인 Transformer 모델을 통한 대장 폴립 세그멘테이션
Nguyen Hoang Thuan, Nguyen Thi Oanh, Nguyen Thi Thuy, Stuart Perry, Dinh Viet Sang

초록
대장 폴립의 자동적이고 정확한 분할은 대장암의 조기 진단에 필수적이다. 고급 딥러닝 모델들은 폴립 분할 작업에서 희망적인 결과를 보여주고 있으나, 여전히 다중 스케일 특징 표현 능력과 일반화 성능 측면에서 한계를 지닌다. 이러한 문제를 해결하기 위해 본 논문에서는 인코더에 경량형 트랜스포머 기반 아키텍처를 도입하여 다수준의 전역적 의미 관계를 모델링하는 RaBiT라는 인코더-디코더 구조를 제안한다. 디코더는 여러 개의 양방향 특징 피라미드 레이어와 역방향 주의(Reverse Attention) 모듈을 포함하여 다양한 수준의 특징맵을 더 효과적으로 융합하고 폴립 경계를 점진적으로 정교화한다. 또한 역방향 주의 모듈을 경량화하고 다중 클래스 분할에 더 적합하도록 개선하는 아이디어를 제안한다. 여러 기준 데이터셋에서 실시한 광범위한 실험 결과, 제안한 방법은 모든 데이터셋에서 기존 방법들을 상회하면서도 낮은 계산 복잡도를 유지함을 확인하였다. 더불어, 학습 및 테스트 세트의 특성이 서로 다를 경우에도 교차 데이터셋 실험에서 높은 일반화 성능을 보여, 실제 임상 환경에서의 적용 가능성을 입증하였다.