2달 전
NanoNet: 비디오 캡슐 내시경 및 대장내시경에서의 실시간 폴립 분할
Jha, Debesh ; Tomar, Nikhil Kumar ; Ali, Sharib ; Riegler, Michael A. ; Johansen, Håvard D. ; Johansen, Dag ; de Lange, Thomas ; Halvorsen, Pål

초록
심층 학습은 소화기 내시경에서 임상 성능을 향상시키고 병변을 더욱 정확하게 평가하는 데 도움이 될 수 있습니다. 이를 위해, 암이나 전암 병변의 경계를 식별하는 등 관심 영역의 자동 실시간 구분을 수행할 수 있는 의미 분할 방법이 진단과 치료에 이점을 제공할 수 있습니다. 그러나, 내시경 이미지의 정확하고 실시간 분할은 그 높은 조작자 의존성과 고해상도 이미지 품질 때문에 매우 어려운 과제입니다. 임상 환경에서 자동화된 방법을 활용하기 위해서는 지연 시간이 낮고 가벼운 모델 설계가 필수적입니다. 이를 통해 저사양 내시경 하드웨어 장치와 통합할 수 있게 됩니다.본 연구에서는 비디오 캡슐 내시경 및 대장내시경 이미지의 분할을 위한 새로운 아키텍처인 NanoNet을 제안합니다. 제안된 아키텍처는 실시간 성능을 제공하며, 다른 더 복잡한 모델들보다 높은 분할 정확도를 보입니다. 우리는 폴립이 포함된 비디오 캡슐 내시경 및 표준 대장내시경 데이터셋과 내시경 생검 및 수술 도구를 포함하는 데이터셋을 사용하여 본 접근법의 효과성을 평가하였습니다. 실험 결과, 모델의 복잡성, 속도, 모델 매개변수, 그리고 메트릭 성능 간의 균형에서 본 아키텍처의 성능 향상을 입증하였습니다. 또한, 전통적인 심층 학습 접근법들이 수백만 개의 매개변수를 가지는 것과 비교하여 NanoNet은 약 36,000개의 매개변수로 상대적으로 작은 모델 크기를 가지고 있습니다.