Referlt3D 数据集适用于 3D visual grounding 及 3D dense captioning 任务,包括 2 个大规模 visio-linguistic 互补的数据集:
- Sr3D 数据集:包含 83.5K 基于模板的句子,利用细粒度对象类之间的空间关系,定位场景中引用的对象;
- Nr3D 数据集:包括 41.5K 自然发生、形式不限的句子,这些句子是通过在 3D 场景中部署一个 2 人游戏收集的 。
2 做种
0 下载
127 已完成
- Referlt3D/README.md 1.13 KB
- Referlt3D/README.txt 1.13 KB
- Referlt3D/data/Nr3D/nr3d.csv 10.2 MB
- Referlt3D/data/Sr3D/sr3d+.csv 27.55 MB
- Referlt3D/data/Sr3D/sr3d.csv 19.37 MB
- Referlt3D/data/Sr3D/sr3d_test.csv 4.21 MB
- Referlt3D/data/Sr3D/sr3d_train.csv 15.58 MB