17일 전

PP-PicoDet: 모바일 디바이스에서 더 나은 실시간 객체 탐지기

Guanghua Yu, Qinyao Chang, Wenyu Lv, Chang Xu, Cheng Cui, Wei Ji, Qingqing Dang, Kaipeng Deng, Guanzhong Wang, Yuning Du, Baohua Lai, Qiwen Liu, Xiaoguang Hu, Dianhai Yu, Yanjun Ma
PP-PicoDet: 모바일 디바이스에서 더 나은 실시간 객체 탐지기
초록

정확도와 효율성 간의 균형은 객체 탐지 분야에서 오랫동안 해결되지 않은 도전 과제였다. 본 연구에서는 객체 탐지의 정확도와 효율성을 향상시키기 위해 핵심 최적화 기법과 신경망 아키텍처 선택에 집중한다. 특히, 경량 객체 탐지 모델에 대한 앵커리스 전략의 적용 가능성을 탐구한다. 백본 구조를 개선하고, 네트워크의 특징 추출 능력을 향상시키기 위해 경량화된 넥 구조를 설계하였다. 또한, 레이블 할당 전략과 손실 함수를 개선하여 학습의 안정성과 효율성을 높였다. 이러한 최적화를 통해 실시간 객체 탐지 모델의 새로운 패밀리인 PP-PicoDet를 개발하였으며, 이는 모바일 장치에서 객체 탐지 성능에서 뛰어난 성과를 달성하였다. 다른 인기 있는 모델들과 비교해 정확도와 지연 시간 사이의 균형이 더욱 우수하다. PicoDet-S는 단지 0.99M 파라미터만을 사용하여 30.6%의 mAP를 달성하였으며, YOLOX-Nano 대비 mAP는 4.8% 향상되었고, 모바일 CPU 추론 지연 시간은 55% 감소하였다. 또한 NanoDet 대비 mAP는 7.1% 향상되었다. 입력 크기가 320일 때 모바일 ARM CPU에서 123 FPS(패들라이트를 사용 시 150 FPS)를 달성한다. PicoDet-L은 단지 3.3M 파라미터만을 사용하여 40.9%의 mAP를 기록하였으며, YOLOv5s 대비 mAP는 3.7% 향상되고, 추론 속도는 44% 빨라졌다. 그림 1과 같이, 본 연구의 모델은 경량 객체 탐지 분야에서 최신 기술 수준을 크게 초월한다. 코드와 사전 학습된 모델은 https://github.com/PaddlePaddle/PaddleDetection 에서 확인할 수 있다.

PP-PicoDet: 모바일 디바이스에서 더 나은 실시간 객체 탐지기 | 최신 연구 논문 | HyperAI초신경