HyperAIHyperAI

Command Palette

Search for a command to run...

il y a 7 jours

InteractMove : Génération d'interactions homme-objet contrôlée par texte dans des scènes 3D comprenant des objets déplaçables

Xinhao Cai Minghang Zheng Xin Jin Yang Liu

InteractMove : Génération d'interactions homme-objet contrôlée par texte dans des scènes 3D comprenant des objets déplaçables

Résumé

Nous proposons une nouvelle tâche : la génération d’interactions humain-objet contrôlées par texte dans des scènes 3D comprenant des objets mobiles. Les bases de données existantes d’interactions humain-scène souffrent d’un nombre insuffisant de catégories d’interactions et considèrent généralement uniquement des objets statiques (dont la position ne change pas), tandis que la collecte de telles bases de données incluant des objets mobiles s’avère difficile et coûteuse. Pour remédier à ce problème, nous construisons le jeu de données InteractMove, dédié aux interactions humain-objet mobiles dans des scènes 3D, en alignant des données existantes d’interactions humain-objet sur des contextes scéniques. Ce jeu de données présente trois caractéristiques clés : 1) des scènes contenant plusieurs objets mobiles, avec des spécifications d’interaction contrôlées par texte (incluant des distracteurs de même catégorie, exigeant une compréhension spatiale et contextuelle de la scène 3D) ; 2) une diversité de types et de tailles d’objets, associée à des schémas d’interaction variés (une main, deux mains, etc.) ; 3) des trajectoires de manipulation d’objets physiquement plausibles. L’introduction d’objets mobiles rend cette tâche plus exigeante, car le modèle doit non seulement identifier avec précision les objets à interagir, mais aussi apprendre à interagir avec des objets de tailles et de catégories différentes, tout en évitant les collisions entre les objets mobiles et l’environnement. Pour relever ces défis, nous proposons une nouvelle solution en pipeline. Nous utilisons d’abord des modèles de repérage visuel 3D pour identifier l’objet d’interaction. Ensuite, nous introduisons une approche d’apprentissage conjoint des possibilités d’interaction (affordances) main-objet, permettant de prédire les zones de contact pour différentes articulations de la main et différentes parties de l’objet, ce qui permet une saisie et une manipulation précises d’objets variés. Enfin, nous optimisons les interactions grâce à une modélisation locale de la scène et à des contraintes d’évitement de collision, garantissant des mouvements physiquement plausibles et l’absence de collisions entre objets et environnement. Des expériences approfondies démontrent la supériorité de notre méthode par rapport aux approches existantes en matière de génération d’interactions physiquement plausibles et conformes aux instructions textuelles.

Construire l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec du co-codage IA gratuit, un environnement prêt à l'emploi et les meilleurs prix GPU.

Co-codage IA
GPU prêts à utiliser
Meilleurs prix
Commencer

Hyper Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
InteractMove : Génération d'interactions homme-objet contrôlée par texte dans des scènes 3D comprenant des objets déplaçables | Articles de recherche | HyperAI