COMMA: 병행하는 보완적 다중 레벨 집계 네트워크를 통한 폴립 세그멘테이션
대장내시경은 대장암 예방을 위해 폴립을 탐지하는 효과적인 방법이다. 기존 연구들은 합성 신경망(Convolutional Neural Networks, CNNs)에서 저수준 경계 정보와 고수준 영역 정보를 통합함으로써 대장내시경 영상에서 폴립의 정밀한 세그멘테이션 성능을 충분히 달성해왔다. 그러나 다양한 레이어 표현을 통합할 때 발생하는 분포 불일치로 인해 다수준 통합은 폴립 세그멘테이션 성능에 한계를 가진다. 이 문제를 해결하기 위해 기존 연구들은 저수준과 고수준 표현을 보완하는 방식을 활용해왔다. 본 연구는 기존 방법들과는 달리, 보완 정보를 전파하는 데 초점을 맞추어, 저수준의 명시적 경계 정보와 고수준의 추상화된 표현 간의 불일치를 줄이는 방식을 제안한다. 본 연구는 분포 불일치를 완화하기 위해 보완적인 다수준 통합을 전파하는 COMMA를 제안한다. COMMA는 보완 마스킹 모듈(Complementary Masking Module, CMM)과 경계 전파 모듈(Boundary Propagation Module, BPM)을 포함하는 다중 디코더 구조로 구성된다. CMM은 추상화된 고수준 표현을 통해 저수준 경계 노이즈를 마스킹하고, 마스킹된 정보를 두 수준 모두에서 활용한다. 비슷하게, BPM은 최저수준과 최고수준 표현을 통합하여 명시적인 경계 정보를 얻고, 이를 CMM으로 전파하여 폴립 탐지 성능을 향상시킨다. CMM은 경계 정보와 보완적 표현을 기반으로 기존 CMM보다 더 정교하게 폴립을 구분할 수 있다. 또한, 폴립 세그멘테이션에서 발생하는 클래스 불균형과 노이즈가 있는 레이블 문제를 완화하기 위해 하이브리드 손실 함수를 제안한다. COMMA의 성능을 평가하기 위해 다섯 가지 벤치마크 데이터셋과 다섯 가지 평가 지표를 사용하여 실험을 수행하였다. 실험 결과, 제안한 네트워크가 모든 데이터셋에서 최신 기술 대비 우수한 성능을 보였으며, 특히 기존 최고 성능 기법 대비 평균적으로 mIoU 성능을 0.043 향상시켰다.