11일 전
PP-LiteSeg: 실시간 세분화 모델 중 최고의 성능을 갖춘 모델
Juncai Peng, Yi Liu, Shiyu Tang, Yuying Hao, Lutao Chu, Guowei Chen, Zewu Wu, Zeyu Chen, Zhiliang Yu, Yuning Du, Qingqing Dang, Baohua Lai, Qiwen Liu, Xiaoguang Hu, Dianhai Yu, Yanjun Ma

초록
실제 응용 분야는 의미 분할(semantic segmentation) 기법에 높은 요구를 한다. 딥러닝의 발전으로 의미 분할 기술은 큰 진전을 이뤘지만, 실시간 처리를 위한 방법들의 성능은 여전히 만족스럽지 못하다. 본 연구에서는 실시간 의미 분할 작업을 위한 새로운 경량 모델인 PP-LiteSeg를 제안한다. 구체적으로, 기존 디코더의 계산 부담을 줄이기 위해 유연하고 경량적인 디코더(Flexible and Lightweight Decoder, FLD)를 제안한다. 또한 특징 표현력을 강화하기 위해 공간적 주의력과 채널 주의력을 활용하여 가중치를 생성하고, 입력 특징을 해당 가중치와 결합하는 통합 주의력 융합 모듈(Understood Attention Fusion Module, UAFM)을 제안한다. 더불어, 낮은 계산 비용으로 전역적인 맥락 정보를 효과적으로 집계하기 위해 단순한 피라미드 풀링 모듈(Simple Pyramid Pooling Module, SPPM)을 도입한다. 광범위한 실험 결과를 통해 PP-LiteSeg가 다른 기법들에 비해 정확도와 속도 사이에서 뛰어난 균형을 달성함을 입증하였다. Cityscapes 테스트 세트에서 NVIDIA GTX 1080Ti 기준으로 각각 72.0% mIoU/273.6 FPS 및 77.5% mIoU/102.6 FPS의 성능을 기록하였다. 소스 코드 및 모델은 PaddleSeg에서 공개되어 있다: https://github.com/PaddlePaddle/PaddleSeg.