
초록
결장내시경은 금준(gold standard) 절차이지만, 수행자의 기술에 크게 의존합니다. 자동 폴립 분할은 전암병변을 감지하여 결장암의 조기 발견과 적시적인 치료를 가능하게 함으로써 놓치는 비율을 최소화할 수 있습니다. 이와 관련된 작업을 위해 개발된 딥러닝 방법들이 있지만, 폴립 크기의 다양성이 모델 학습에 영향을 미쳐, 훈련 데이터셋에서 가장 많은 샘플이 가지는 크기 속성에 한정되게 되어 다른 크기의 폴립에 대해 비최적 결과를 제공할 수 있습니다. 본 연구에서는 학습 과정에서 폴립 크기와 폴립 수량과 관련된 특징들을 텍스트 어텐션(text attention) 형태로 활용하였습니다. 우리는 보조 분류 작업을 도입하여 텍스트 기반 임베딩의 가중치를 조절함으로써 네트워크가 다른 크기의 폴립에 독특하게 적응하고 다수의 폴립이 있는 경우에도 적응할 수 있는 추가적인 특징 표현을 학습하도록 하였습니다. 실험 결과, 이러한 추가 텍스트 임베딩은 최신 세그멘테이션 방법론보다 모델의 전체 성능을 개선하는 것으로 나타났습니다. 우리는 네 가지 다른 데이터셋을 탐구하였으며, 크기에 따른 개선 사항에 대한 통찰력을 제공하였습니다. 제안된 텍스트 안내 어텐션 네트워크(TGANet)는 다양한 크기의 폴립이 포함된 다른 데이터셋에서도 잘 일반화될 수 있음을 보여주었습니다.