2ヶ月前

YOLO-Pose: オブジェクトキーポイント類似度損失を用いた多人数姿勢推定のためのYOLOの強化

Debapriya Maji; Soyeb Nagori; Manu Mathew; Deepak Poddar
YOLO-Pose: オブジェクトキーポイント類似度損失を用いた多人数姿勢推定のためのYOLOの強化
要約

YOLO-poseの紹介:これは、YOLOオブジェクト検出フレームワークに基づく新しいヒートマップを用いない関節検出および2D多人物姿勢推定手法です。既存のヒートマップベースの二段階アプローチは、エンドツーエンドで学習できないため非最適であり、学習は評価指標であるオブジェクトキーポイント類似度(OKS)の最大化とは等しくない代替L1損失に依存しています。私たちのフレームワークは、モデルをエンドツーエンドで学習させ、OKS指標自体を最適化することを可能にします。提案されたモデルは、単一の順方向パスで複数の人々のバウンディングボックスとそれに対応する2D姿勢を同時検出することで、トップダウンとボトムアップアプローチ双方の長所を取り入れています。提案手法では、各バウンディングボックスに関連した姿勢があるため、ボトムアップアプローチで必要となる検出されたキーポイントを骨格にグループ化する後処理が不要となり、キーポイントが内在的にグループ化されます。トップダウンアプローチとは異なり、すべての人々が単一の推論で位置決めされると同時にその姿勢も推定されるため、複数回の順方向パスが省かれます。YOLO-poseはCOCOバリデーションセット(AP50: 90.2%)およびテスト開発セット(AP50: 90.3%)において新たな最先端の結果を達成し、フリップテストや多スケールテストなどの任意のテスト時の拡張なしで既存のすべてのボトムアップアプローチを超える性能を示しました。本論文で報告されているすべての実験と結果は、従来の手法がパフォーマンス向上のためにフリップテストや多スケールテストを使用しているのに比べて、任意のテスト時の拡張なしに行われています。私たちの学習コードは以下のURLで公開されます:https://github.com/TexasInstruments/edgeai-yolov5 および https://github.com/TexasInstruments/edgeai-yolox

YOLO-Pose: オブジェクトキーポイント類似度損失を用いた多人数姿勢推定のためのYOLOの強化 | 最新論文 | HyperAI超神経