ROCKET-2 est un framework de contrôle de mouvement visuel pour l'alignement de cibles à vues croisées lancé par l'équipe CraftJarvis le 21 mars 2025. Concentrez-vous sur la résolution de problèmes complexes de contrôle de tâches dans le domaine de la robotique. Ce projet améliore considérablement la capacité de généralisation et la contrôlabilité de la stratégie de mouvement visuel (politique visuomotrice) dans des environnements dynamiques grâce à une technologie innovante d'alignement de cibles multi-vues. Les résultats pertinents de l'article sontROCKET-2 : Pilotage de la politique visuomotrice via l'alignement des objectifs croisés".
Ce tutoriel utilise des ressources pour une seule carte RTX 4090.
2. Exemples de projets
3. Étapes de l'opération
1. Après avoir démarré le conteneur, cliquez sur l'adresse API pour accéder à l'interface Web
Si « Bad Gateway » s'affiche, cela signifie que le modèle est en cours d'initialisation. Étant donné que le modèle est grand, veuillez patienter environ 1 à 2 minutes et actualiser la page.
2. Après être entré sur la page Web, vous pouvez démarrer une conversation avec le modèle
Comment utiliser
Accédez au didacticiel pour afficher le guide du didacticiel
Entrez dans Personnaliser l'environnement et sélectionnez l'environnement que vous souhaitez charger
Entrez dans l'environnement de chargement de la fusée de lancement
Entrez Spécifier l'objectif et sélectionnez le point cible et la méthode d'interaction
Accédez au panneau de configuration de Launch Rocket et sélectionnez le modèle
Accédez au panneau de configuration de Launch Rocket pour définir les étapes d'inférence et effectuer l'inférence
Répétez les étapes 4 à 6 jusqu’à ce que le processus d’inférence soit terminé. Ensuite, entrez dans le mode Enregistrer la vidéo pour créer et télécharger la vidéo. Cette vidéo n'est pas disponible en ligne.
4. Discussion
🖌️ Si vous voyez un projet de haute qualité, veuillez laisser un message en arrière-plan pour le recommander ! De plus, nous avons également créé un groupe d’échange de tutoriels. Bienvenue aux amis pour scanner le code QR et commenter [Tutoriel SD] pour rejoindre le groupe pour discuter de divers problèmes techniques et partager les résultats de l'application↓
Informations sur la citation
Les informations de citation pour ce projet sont les suivantes :
@article{cai2025rocket,
title={ROCKET-2: Steering Visuomotor Policy via Cross-View Goal Alignment},
author={Cai, Shaofei and Mu, Zhancun and Liu, Anji and Liang, Yitao},
journal={arXiv preprint arXiv:2503.02505},
year={2025}
}