Command Palette
Search for a command to run...
RoVid-X ロボット ビデオ生成データセット
RoVid-Xは、北京大学がByteDance Seedと共同で2026年に公開したロボット動画生成データセットです。関連する研究論文は以下の通りです。 身体化された世界のためのビデオ生成モデルの再考これは、ロボット ビデオを生成する際にビデオ生成モデルが直面する物理的な課題に対処することを目的としています。
このデータセットには、約400万本のロボット動画クリップが含まれており、総時間数は1万時間を超え、1,300種類以上のきめ細かなロボットスキルを網羅しています。動画には、RGB、深度、オプティカルフロー情報などのマルチモーダルな物理的注釈が付与されており、複数のロボットやタスクにわたる多様性をサポートし、様々なロボットの種類、シナリオ、動作スキルを網羅しています。
データセットの構成:
- ロボットのビデオクリップ400万本
- マルチモーダルな物理的注釈(RGB、深度、オプティカルフロー)
- 1,300以上のきめ細かなロボットスキル