3달 전

ColonFormer: 결장 폴립 세그멘테이션을 위한 효율적인 Transformer 기반 방법

Nguyen Thanh Duc, Nguyen Thi Oanh, Nguyen Thi Thuy, Tran Minh Triet, Dinh Viet Sang
ColonFormer: 결장 폴립 세그멘테이션을 위한 효율적인 Transformer 기반 방법
초록

내시경 영상의 자동 분석에서 폴립 식별은 컴퓨터 지원 진료 시스템에서 중요한 과제이다. 컨볼루션 신경망(CNN), 트랜스포머, 그리고 이들의 결합 기반 모델들이 폴립 세그멘테이션에 있어 유망한 성과를 보여주었으나, 이러한 접근 방식들은 폴립의 국소적 외형만을 모델링하거나, 디코딩 과정에서 공간적 종속성에 대한 다수준 특징을 충분히 반영하지 못하는 한계를 지닌다. 본 논문은 이러한 한계를 극복하기 위해 새로운 네트워크인 ColonFormer을 제안한다. ColonFormer은 인코더 및 디코더 브랜치 모두에서 장거리 의미 정보를 모델링할 수 있는 인코더-디코더 아키텍처이다. 인코더는 다중 스케일에서 전반적인 의미 관계를 모델링하기 위해 트랜스포머 기반의 경량 아키텍처로 구성되어 있으며, 디코더는 다수준 특징을 학습하여 특징 표현을 풍부하게 하는 계층적 네트워크 구조로 설계되었다. 또한, 전역 맵 내 폴립 객체의 경계를 정밀하게 보정하기 위해 새로운 스킵 연결 기법을 적용한 정제 모듈을 추가하였다. 제안된 ColonFormer은 Kvasir, CVC-Clinic DB, CVC-ColonDB, CVC-T, ETIS-Larib 등 5개의 대표적 폴립 세그멘테이션 벤치마크 데이터셋에서 광범위한 실험을 수행하였으며, 실험 결과 모든 벤치마크 데이터셋에서 기존 최첨단 방법들을 초월하는 성능을 입증하였다.