Command Palette

Search for a command to run...

OST-Bench 时空场景理解基准数据集

日期

11 小时前

机构

The University of Hong Kong
上海交通大学
上海人工智能实验室

论文链接

2507.07984

许可协议

非商业用途

加入 Discord 社区

OST-Bench 是由上海人工智能实验室联合上海交通大学、香港大学等机构于 2025 年发布的,用于评估多模态大模型在线时空场景理解能力的数据集,相关论文成果为「OST-Bench: Evaluating the Capabilities of MLLMs in Online Spatio-temporal Scene Understanding」,旨在用于评测多模态大模型在在线场景探索、可见信息建模与时空推理任务中的综合理解能力。

该数据集共选取约 1,400 个真实室内三维场景,并基于场景探索过程生成约 10,000 条多轮时序问答样本。场景来源于 ScanNet 、 ARKitScenes 与 Matterport3D,并基于统一的三维物体与语义标注进行处理;在每个场景中构建连续视角探索轨迹,并根据累积可见信息生成对应问答内容。任务设计覆盖三大核心理解方向,包括代理状态、可见信息与代理–物体空间关系,共细化为 15 种子任务,以多轮对话形式呈现,要求模型根据历史观测与当前视野进行在线时空推理。

数据集分布

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
OST-Bench 时空场景理解基准数据集 | 数据集 | HyperAI超神经