HyperAIHyperAI

Command Palette

Search for a command to run...

RoVid-X ロボット ビデオ生成データセット

Discordで議論

日付

4時間前

データセット構成

北京大学
バイトダンスシード

Paper URL

2601.15282

ライセンス

CC BY 4.0

RoVid-Xは、北京大学がByteDance Seedと共同で2026年に公開したロボット動画生成データセットです。関連する研究論文は以下の通りです。 身体化された世界のためのビデオ生成モデルの再考これは、ロボット ビデオを生成する際にビデオ生成モデルが直面する物理的な課題に対処することを目的としています。

このデータセットには、約400万本のロボット動画クリップが含まれており、総時間数は1万時間を超え、1,300種類以上のきめ細かなロボットスキルを網羅しています。動画には、RGB、深度、オプティカルフロー情報などのマルチモーダルな物理的注釈が付与されており、複数のロボットやタスクにわたる多様性をサポートし、様々なロボットの種類、シナリオ、動作スキルを網羅しています。

データセットの構成:

  • ロボットのビデオクリップ400万本
  • マルチモーダルな物理的注釈(RGB、深度、オプティカルフロー)
  • 1,300以上のきめ細かなロボットスキル

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています