
본 논문에서는 정확하고 빠른 의미 분할을 위한 새로운 아키텍처인 ShelfNet을 제시합니다. 단일 인코더-디코더 구조와는 달리, ShelfNet은 각 공간 수준에서 스킵 연결을 가진 여러 개의 인코더-디코더 분기 쌍을 포함하며, 이 구조는 여러 열이 있는 선반처럼 보입니다. 선반 형태의 구조는 여러 깊고 얕은 경로의 앙상블로 볼 수 있어 정확도를 향상시키는 역할을 합니다. 또한 채널 수를 줄임으로써 계산 부담을 크게 줄였으며, 이 독특한 구조를 통해 높은 정확도를 달성하였습니다. 더불어 잔차 블록에서 공유 가중치 전략을 제안하여 성능 저하 없이 매개변수 수를 줄였습니다.PASCAL VOC 데이터셋에서 인기 있는 실시간 비대응 방법인 PSPNet과 비교하여, 우리의 ShelfNet은 유사한 정확도로 4배 더 빠른 추론 속도를 제공합니다. 실시간 세그멘테이션 모델인 BiSeNet과 비교하면, 시티스케이프즈(Cityscapes) 데이터셋에서 유사한 속도로 더 높은 정확도를 달성하여 자율 주행용 도로 장면 이해 등 속도가 요구되는 작업에 적용할 수 있습니다. 더욱이, ResNet34 백본을 사용한 시티스케이프즈(Cityscapes) 데이터셋에서 우리의 ShelfNet은 79.0%의 mIoU를 기록하며, ResNet101과 같은 큰 백본을 사용하는 PSPNet과 BiSeNet보다 우수한 성능을 보여주었습니다.다양한 실험을 통해 우리는 ShelfNet의 우월한 성능을 검증하였습니다. 본 논문에서는 구현 코드에 대한 링크(\url{https://github.com/juntang-zhuang/ShelfNet-lw-cityscapes})를 제공합니다.