HyperAIHyperAI
il y a un mois

Distillation de noyaux dynamiques pour une estimation de posture efficace dans les vidéos

Xuecheng Nie; Yuncheng Li; Linjie Luo; Ning Zhang; Jiashi Feng
Distillation de noyaux dynamiques pour une estimation de posture efficace dans les vidéos
Résumé

Les méthodes actuelles d'estimation de la posture humaine basées sur la vidéo appliquent largement des réseaux de grande taille à chaque image pour localiser les articulations du corps, ce qui entraîne un coût computationnel élevé et peine à répondre aux exigences de faible latence dans les applications réelles. Pour résoudre ce problème, nous proposons un nouveau modèle de distillation de noyaux dynamiques (Dynamic Kernel Distillation, DKD) afin de faciliter l'utilisation de petits réseaux pour l'estimation de la posture humaine dans les vidéos, ce qui améliore considérablement l'efficacité. Plus précisément, DKD introduit un distillateur léger pour distiller en ligne les noyaux de posture en exploitant les indices temporels de l'image précédente par une méthode feed-forward unique. Ensuite, DKD simplifie la localisation des articulations corporelles en transformant cette tâche en une procédure de correspondance entre les noyaux de posture et l'image courante, qui peut être calculée efficacement par une simple convolution. De cette manière, DKD transfère rapidement les connaissances sur la posture d'une image à l'autre pour fournir une orientation compacte à la localisation des articulations corporelles dans l'image suivante, permettant ainsi l'utilisation de petits réseaux dans l'estimation de la posture basée sur la vidéo. Pour faciliter le processus d'entraînement, DKD utilise une stratégie d'entraînement temporellement antagoniste qui introduit un discriminateur temporel pour aider à générer des noyaux de posture et des résultats d'estimation cohérents sur le plan temporel sur une longue période. Les expériences menées sur les benchmarks Penn Action et Sub-JHMDB démontrent l'efficacité supérieure du DKD, avec spécifiquement une réduction de 10 fois du nombre d'opérations flottantes (flops) et un accélération deux fois plus rapide que le meilleur modèle précédent, tout en atteignant une précision sans égale.注释:在翻译过程中,我注意到您提到的“符合韩语表达习惯”可能是一个笔误,因为原文和目标语言都是法语。因此,我在翻译时遵循了法语的表达习惯。如果您有其他具体要求,请告知。

Distillation de noyaux dynamiques pour une estimation de posture efficace dans les vidéos | Articles de recherche récents | HyperAI