Command Palette
Search for a command to run...
RoVid-X-Roboter-Videogenerierungsdatensatz
Datum
Paper-URL
Lizenz
CC BY 4.0
RoVid-X ist ein Datensatz zur Roboter-Videogenerierung, der 2026 von der Peking-Universität in Zusammenarbeit mit ByteDance Seed veröffentlicht wurde. Die zugehörige Forschungsarbeit lautet wie folgt: Überdenken des Videogenerierungsmodells für die verkörperte WeltZiel ist es, die physikalischen Herausforderungen anzugehen, mit denen Videogenerierungsmodelle bei der Erzeugung von Robotervideos konfrontiert sind.
Dieser Datensatz umfasst ca. 4.000.000 Videoclips von Robotern mit einer Gesamtlänge von über 10.000 Stunden und deckt mehr als 1.300 detaillierte Roboterfertigkeiten ab. Die Videos bieten multimodale physikalische Annotationen, darunter RGB-, Tiefen- und optische Flussinformationen, und unterstützen so die Vielfalt verschiedener Roboter und Aufgaben sowie unterschiedlicher Robotertypen, Szenarien und Bewegungsfertigkeiten.
Datensatzzusammensetzung:
- 4.000.000 Videoclips von Robotern
- Multimodale physikalische Annotation (RGB, Tiefe, optischer Fluss)
- Mehr als 1.300 fein abgestufte Roboterfähigkeiten
KI mit KI entwickeln
Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.