Command Palette
Search for a command to run...
RoVid-X 로봇 비디오 생성 데이터 세트
RoVid-X는 베이징 대학이 ByteDance Seed와 협력하여 2026년에 공개한 로봇 비디오 생성 데이터셋입니다. 관련 연구 논문은 다음과 같습니다. 몸으로 체현된 세계를 위한 비디오 생성 모델 재고찰이 연구는 로봇 영상을 생성할 때 영상 생성 모델이 직면하는 물리적 문제를 해결하는 것을 목표로 합니다. 이 데이터 세트는 약 400만 개의 로봇 비디오 클립으로 구성되어 있으며, 총 길이는 1만 시간이 넘고 1,300개 이상의 세부적인 로봇 동작을 보여줍니다. 비디오에는 RGB, 깊이, 광류 정보 등 다양한 물리적 주석이 포함되어 있어 여러 로봇과 작업, 다양한 로봇 유형, 시나리오 및 동작 기술을 포괄합니다. 데이터 세트 구성:
- 로봇이 나오는 비디오 클립 400만 개
- 다중 모달 물리적 주석(RGB, 깊이, 광류)
- 1,300개 이상의 세밀한 로봇 기능