2ヶ月前

RTMPose: MMPoseを基にしたリアルタイム多人物姿勢推定

Jiang, Tao ; Lu, Peng ; Zhang, Li ; Ma, Ningsheng ; Han, Rui ; Lyu, Chengqi ; Li, Yining ; Chen, Kai
RTMPose: MMPoseを基にしたリアルタイム多人物姿勢推定
要約

最近の2次元姿勢推定に関する研究では、公開ベンチマークにおいて優れた性能が達成されていますが、産業界での応用は依然として重いモデルパラメータと高いレイテンシに悩まされています。このギャップを埋めるために、我々は姿勢推定における重要な要因であるパラダイム、モデルアーキテクチャ、学習戦略、およびデプロイメントについて実証的に探求し、MMPoseに基づく高性能リアルタイム多人数姿勢推定フレームワークRTMPoseを提案します。RTMPose-mはIntel i7-11700 CPUで90FPS以上、NVIDIA GTX 1660 Ti GPUで430FPS以上を達成し、COCOデータセットで75.8%のAP(平均精度)を記録しています。また、RTMPose-lはCOCO-WholeBodyデータセットで67.0%のAPを達成し、130FPS以上の性能を示しています。さらに、RTMPoseのリアルタイム応用における能力を評価するために、モバイルデバイス上でのデプロイ後の性能も報告します。RTMPose-sはSnapdragon 865チップ上で70FPS以上を達成し、COCOデータセットで72.2%のAPを記録しており、既存のオープンソースライブラリを上回っています。コードとモデルは以下のURLから公開されています: https://github.com/open-mmlab/mmpose/tree/1.x/projects/rtmpose。

RTMPose: MMPoseを基にしたリアルタイム多人物姿勢推定 | 最新論文 | HyperAI超神経