TransNetR: 다중 센터 외부 분포 테스트를 위한 폴립 세그멘테이션을 위한 트랜스포머 기반 잔차 네트워크

대장내시경은 대장암(CRC) 및 그 전구 병변인 폴립을 감지하기 위한 가장 효과적인 선별 검사로 여겨집니다. 그러나 폴립의 다양성과 관찰자 간 의존성으로 인해 이 절차는 높은 누락률을 경험하고 있습니다. 따라서, 임상 실무에서 폴립 감지와 분할의 중요성을 고려하여 여러 딥러닝 기반 시스템이 제안되었습니다. 기존의 자동화된 접근 방식들이 개선된 결과를 달성했음에도 불구하고, 실시간 처리 속도를 얻는 데 비효율적이라는 문제가 있습니다. 또한, 다른 센터에서 수집된 환자 간 데이터에 대해 평가할 때 성능 저하가 크게 발생합니다. 이에 따라, 우리는 새로운 실시간 딥러닝 기반 구조인 트랜스포머 기반 잔차 네트워크(TransNetR)를 개발하여 대장 폴립 분할을 수행하고 그 진단 성능을 평가하고자 합니다.제안된 구조인 TransNetR는 사전 학습된 ResNet50을 인코더로, 세 개의 디코더 블록과 네트워크 말미에 업샘플링 계층으로 구성된 인코더-디코더 네트워크입니다. TransNetR은 Kvasir-SEG 데이터셋에서 0.8706의 높은 다이스 계수와 0.8016의 평균 교집합 비율(IoU)을 얻으며, 실시간 처리 속도 54.60을 유지합니다. 또한, 본 연구의 주요 공헌은 훈련 분포와 다른 테스트 분포(out-of-distribution) 데이터셋에서 제안 알고리즘의 일반화 능력을 탐구하는 것입니다.실제 사용 사례로, 우리는 제안한 알고리즘을 PolypGen(6개 독특한 센터) 데이터셋과 두 개의 다른 유명한 폴립 분할 벤치마킹 데이터셋에서 테스트했습니다. out-of-distribution 테스트 중 모든 세 가지 데이터셋에서 최고 수준의 성능을 달성했습니다. TransNetR의 소스 코드는 https://github.com/DebeshJha 에서 공개될 예정입니다.