HyperAIHyperAI

Command Palette

Search for a command to run...

RoVid-X-Roboter-Videogenerierungsdatensatz

Auf Discord diskutieren

Datum

vor 4 Stunden

Organisation

Peking-Universität
ByteDance Seed

Paper-URL

2601.15282

Lizenz

CC BY 4.0

RoVid-X ist ein Datensatz zur Roboter-Videogenerierung, der 2026 von der Peking-Universität in Zusammenarbeit mit ByteDance Seed veröffentlicht wurde. Die zugehörige Forschungsarbeit lautet wie folgt: Überdenken des Videogenerierungsmodells für die verkörperte WeltZiel ist es, die physikalischen Herausforderungen anzugehen, mit denen Videogenerierungsmodelle bei der Erzeugung von Robotervideos konfrontiert sind.

Dieser Datensatz umfasst ca. 4.000.000 Videoclips von Robotern mit einer Gesamtlänge von über 10.000 Stunden und deckt mehr als 1.300 detaillierte Roboterfertigkeiten ab. Die Videos bieten multimodale physikalische Annotationen, darunter RGB-, Tiefen- und optische Flussinformationen, und unterstützen so die Vielfalt verschiedener Roboter und Aufgaben sowie unterschiedlicher Robotertypen, Szenarien und Bewegungsfertigkeiten.

Datensatzzusammensetzung:

  • 4.000.000 Videoclips von Robotern
  • Multimodale physikalische Annotation (RGB, Tiefe, optischer Fluss)
  • Mehr als 1.300 fein abgestufte Roboterfähigkeiten

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp