HyperAIHyperAI

Command Palette

Search for a command to run...

Apprentissage multimodal multipartite pour la reconnaissance d'actions dans les vidéos en profondeur

Shahroudy Amir Wang Gang Ng Tian-Tsong Yang Qingxiong

Résumé

La nature articulée et complexe des actions humaines rend la reconnaissance d’actions particulièrement difficile. Une approche permettant de gérer cette complexité consiste à décomposer les actions en cinématiques des différentes parties du corps, puis à analyser les actions à partir de descripteurs partiels. Nous proposons une méthode d’apprentissage basée sur une régression parcimonieuse conjointe, qui exploite la parcimonie structurée pour modéliser chaque action comme une combinaison de caractéristiques multimodales provenant d’un ensemble restreint de parties corporelles. Pour représenter la dynamique et l’apparence de ces parties, nous utilisons un ensemble hétérogène de caractéristiques basées sur la profondeur et sur la structure squelettique. La structure appropriée des caractéristiques multipartites multimodales est intégrée dans le cadre d’apprentissage grâce à une norme hiérarchique mixte proposée, qui régularise les caractéristiques structurées de chaque partie tout en imposant une parcimonie entre elles, favorisant ainsi une sélection de groupes de caractéristiques. Nos résultats expérimentaux démontrent l’efficacité de la méthode proposée, qui surpasse les autres approches sur les trois jeux de données testés, atteignant même une précision parfaite sur l’un d’entre eux.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp