17일 전
HarDNet-MSEG: 평균 Dice가 0.9를 초과하고 86 FPS의 속도를 달성하는 간단한 인코더-디코더 폴립 세그멘테이션 신경망
Chien-Hsiang Huang, Hung-Yu Wu, Youn-Long Lin

초록
우리는 폴립 세그멘테이션을 위한 새로운 합성곱 신경망인 HarDNet-MSEG을 제안한다. 이 모델은 다섯 가지 인기 있는 데이터셋에서 정확도와 추론 속도 모두에서 최상의 성능(SOTA)을 달성하였다. Kvasir-SEG 데이터셋에서 HarDNet-MSEG은 평균 Dice 스코어 0.904를 기록하며, GeForce RTX 2080 Ti GPU에서 86.7 FPS의 속도로 실행된다. 본 모델은 백본(Backbone)과 디코더(Decoder)로 구성되어 있다. 백본은 이미지 분류, 객체 탐지, 다중 객체 추적, 세그멘테이션 등 다양한 컴퓨터 비전 작업에 성공적으로 적용된 저메모리 트래픽 합성곱 신경망인 HarDNet68이다. 디코더 부분은 계단식 부분 디코더(Cascaded Partial Decoder)에서 영감을 받아 설계되었으며, 이는 빠르고 정확한 주목적 객체 탐지로 유명하다. 우리는 다섯 가지 인기 있는 데이터셋을 활용하여 HarDNet-MSEG의 성능을 평가하였다. 코드 및 모든 실험 세부 사항은 GitHub에서 공개되어 있다. https://github.com/james128333/HarDNet-MSEG