HyperAIHyperAI

Command Palette

Search for a command to run...

Apprentissage des activités humaines et des affordances d'objets à partir de vidéos RGB-D

Hema Swetha Koppula Rudhir Gupta Ashutosh Saxena

Résumé

La compréhension des activités humaines et des affordances des objets sont deux compétences essentielles, en particulier pour les robots personnels qui opèrent dans des environnements humains. Dans ce travail, nous abordons le problème de l'extraction d'une étiquetage descriptif de la séquence de sous-activités réalisées par un être humain, et plus important encore, de leurs interactions avec les objets sous forme d'affordances associées. Étant donné une vidéo RGB-D, nous modélisons conjointement les activités humaines et les affordances des objets comme un champ aléatoire de Markov où les nœuds représentent les objets et les sous-activités, et les arêtes représentent les relations entre les affordances des objets, leurs relations avec les sous-activités, et leur évolution au fil du temps. Nous formulons le problème d'apprentissage en utilisant une approche de machine à vecteurs de support structurelle (SSVM), où les étiquetages sur différentes segmentations temporelles alternatives sont considérés comme des variables latentes. Nous avons testé notre méthode sur un ensemble de données complexe comprenant 120 vidéos d'activités collectées auprès de 4 sujets, obtenant une précision de 79,4 % pour l'affordance, 63,4 % pour la sous-activité et 75,0 % pour l'étiquetage d'activité de haut niveau. Nous démontrons ensuite l'utilisation d'un tel étiquetage descriptif dans la réalisation de tâches assistives par un robot PR2.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
Apprentissage des activités humaines et des affordances d'objets à partir de vidéos RGB-D | Articles | HyperAI