HyperAI

ROCKET-2: 3D-Spiel Zero-Shot-Transfer

1. Einführung in das Tutorial

Bauen

ROCKET-2 ist ein visuelles Bewegungssteuerungsframework für die Cross-View-Zielausrichtung, das am 21. März 2025 vom CraftJarvis-Team eingeführt wurde. Der Schwerpunkt liegt auf der Lösung komplexer Aufgabensteuerungsprobleme im Bereich der Robotik. Dieses Projekt verbessert die Generalisierungsfähigkeit und Steuerbarkeit der visuellen Bewegungsstrategie (Visuomotor Policy) in dynamischen Umgebungen durch innovative Multi-View-Zielausrichtungstechnologie erheblich. Die relevanten Papierergebnisse sindROCKET-2: Steuerung der Visuomotorik durch Cross-View-Zielausrichtung".

Dieses Tutorial verwendet Ressourcen für eine einzelne RTX 4090-Karte.

2. Projektbeispiele

3. Bedienungsschritte

1. Klicken Sie nach dem Starten des Containers auf die API-Adresse, um die Weboberfläche aufzurufen

Wenn „Bad Gateway“ angezeigt wird, bedeutet dies, dass das Modell initialisiert wird. Da das Modell groß ist, warten Sie bitte etwa 1–2 Minuten und aktualisieren Sie die Seite.

2. Nachdem Sie die Webseite aufgerufen haben, können Sie ein Gespräch mit dem Modell beginnen

Anwendung

  1. Gehen Sie zum Tutorial, um die Anleitung anzuzeigen.
  1. Geben Sie „Umgebung anpassen“ ein und wählen Sie die Umgebung aus, die Sie laden möchten
  1. Rufen Sie die Ladeumgebung von Launch Rocket auf
  1. Geben Sie „Ziel angeben“ ein und wählen Sie den Zielpunkt und die Interaktionsmethode aus
  1. Rufen Sie das Einstellungsfenster von Launch Rocket auf und wählen Sie das Modell aus
  1. Rufen Sie das Control Panel von Launch Rocket auf, um die Inferenzschritte festzulegen und die Inferenz durchzuführen
  1. Wiederholen Sie die Schritte 4–6, bis der Inferenzprozess abgeschlossen ist. Wechseln Sie dann in den Videoaufnahmemodus, um das Video zu erstellen und herunterzuladen. Dieses Video ist nicht online verfügbar.

4. Diskussion

🖌️ Wenn Sie ein hochwertiges Projekt sehen, hinterlassen Sie bitte im Hintergrund eine Nachricht, um es weiterzuempfehlen! Darüber hinaus haben wir auch eine Tutorien-Austauschgruppe ins Leben gerufen. Willkommen, Freunde, scannen Sie den QR-Code und kommentieren Sie [SD-Tutorial], um der Gruppe beizutreten, verschiedene technische Probleme zu besprechen und Anwendungsergebnisse auszutauschen ↓

Zitationsinformationen

Die Zitationsinformationen für dieses Projekt lauten wie folgt:

@article{cai2025rocket,
  title={ROCKET-2: Steering Visuomotor Policy via Cross-View Goal Alignment},
  author={Cai, Shaofei and Mu, Zhancun and Liu, Anji and Liang, Yitao},
  journal={arXiv preprint arXiv:2503.02505},
  year={2025}
}