日期

7 个月前

数据集组织

论文 URL

2512.01816

许可证

MIT

标签

图像生成

Envision 是由上海人工智能实验室于 2025 年发布的一个多图像文本对数据集，相关论文成果为 Envision: Benchmarking Unified Understanding & Generation for Causal World Process Insights，旨在测试模型在真实世界事件中的因果理解与多阶段生成能力。数据集共包含 1,000 个事件序列与 4,000 条四阶段文本提示，涵盖自然科学与人文历史六大领域。事件素材来自教材与在线资料，经专家筛选并由 GPT-4o 生成与润色，形成具备清晰因果链与阶段递进结构的叙事提示。

数据构成：

学科覆盖（共 6 类）

自然科学（占 75%）：物理、化学、生物、气象、地理
历史与文化（占 25%）

因果结构类型

连续型因果：同一空间场景中连续变化，适用于细粒度物理与化学过程
离散型因果：跨时空阶段跳跃，适用于地质演化、生命周期、历史事件
数据集分布和示例

Citation

@article{wei2025ggbench, title={Envision: Benchmarking Unified Understanding & Generation for Causal World Process Insights}, author={Tian, Juanxi and Li, Siyuan and He, Conghui and Wu, Lijun and Tan, Cheng}, journal={arXiv preprint arXiv:2512.01816}, year={2025} }

此数据集由社区用户贡献,仅用于教育和信息目的。如有任何内容涉及版权侵权,请通过 [email protected] 联系我们,我们将及时审核并删除。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

HyperAI

使用此数据集在 Discord 上讨论

日期

7 个月前

数据集组织

论文 URL

2512.01816

许可证

MIT

标签

图像生成

数据构成：

学科覆盖（共 6 类）

自然科学（占 75%）：物理、化学、生物、气象、地理
历史与文化（占 25%）

因果结构类型

连续型因果：同一空间场景中连续变化，适用于细粒度物理与化学过程
离散型因果：跨时空阶段跳跃，适用于地质演化、生命周期、历史事件
数据集分布和示例

Citation

此数据集由社区用户贡献,仅用于教育和信息目的。如有任何内容涉及版权侵权,请通过 [email protected] 联系我们,我们将及时审核并删除。

MAKIEVAL 多语言文化知识评估数据集

1 天前

RHELM 长程记忆评估数据集

3 小时前

SAM 3D Artist Objects 3D 物体重建数据集

1 天前

FigureBench 科学插图生成基准数据集

1 天前

ChartNet 图表理解多模态数据集

19 天前

EAVSD 电商广告视频分镜数据集

19 天前

World Air Pollution and AQI 全球空气质量与 AQI 数据集

19 天前

SMOL 多语言翻译平行数据集

20 天前

ViMU 视频隐喻理解数据集

20 天前

Rice Leaf Diseases 水稻叶片病害检测数据集

20 天前

MemLens 多模态长上下文基准数据集

20 天前

QCalEval 量子校准图表理解数据集

2 个月前

RSRCC 遥感区域变化理解基准数据集

2 天前

Transfermarkt Football 足球转会数据集

2 个月前

MDPBench 多语言文档解析基准数据集

2 天前

World Model Bench 世界模型基准数据集

2 个月前

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

Command Palette

Envision 多阶段事件视觉生成数据集

数据构成：

Citation

用 AI 构建 AI

HyperAI Newsletters

Command Palette

Envision 多阶段事件视觉生成数据集

数据构成：

Citation

相关数据集

MAKIEVAL 多语言文化知识评估数据集

RHELM 长程记忆评估数据集

SAM 3D Artist Objects 3D 物体重建数据集

FigureBench 科学插图生成基准数据集

ChartNet 图表理解多模态数据集

EAVSD 电商广告视频分镜数据集

World Air Pollution and AQI 全球空气质量与 AQI 数据集

SMOL 多语言翻译平行数据集

ViMU 视频隐喻理解数据集

Rice Leaf Diseases 水稻叶片病害检测数据集

MemLens 多模态长上下文基准数据集

QCalEval 量子校准图表理解数据集

RSRCC 遥感区域变化理解基准数据集

Transfermarkt Football 足球转会数据集

MDPBench 多语言文档解析基准数据集

World Model Bench 世界模型基准数据集

用 AI 构建 AI

HyperAI Newsletters

Command Palette

Envision 多阶段事件视觉生成数据集

数据构成：

Citation

相关数据集

MAKIEVAL 多语言文化知识评估数据集

RHELM 长程记忆评估数据集

SAM 3D Artist Objects 3D 物体重建数据集

FigureBench 科学插图生成基准数据集

ChartNet 图表理解多模态数据集

EAVSD 电商广告视频分镜数据集

World Air Pollution and AQI 全球空气质量与 AQI 数据集

SMOL 多语言翻译平行数据集

ViMU 视频隐喻理解数据集

Rice Leaf Diseases 水稻叶片病害检测数据集

MemLens 多模态长上下文基准数据集

QCalEval 量子校准图表理解数据集

RSRCC 遥感区域变化理解基准数据集

Transfermarkt Football 足球转会数据集

MDPBench 多语言文档解析基准数据集

World Model Bench 世界模型基准数据集

用 AI 构建 AI

HyperAI Newsletters

相关数据集

MAKIEVAL 多语言文化知识评估数据集

RHELM 长程记忆评估数据集

SAM 3D Artist Objects 3D 物体重建数据集

FigureBench 科学插图生成基准数据集

ChartNet 图表理解多模态数据集

EAVSD 电商广告视频分镜数据集

World Air Pollution and AQI 全球空气质量与 AQI 数据集

SMOL 多语言翻译平行数据集

ViMU 视频隐喻理解数据集

Rice Leaf Diseases 水稻叶片病害检测数据集

MemLens 多模态长上下文基准数据集

QCalEval 量子校准图表理解数据集

RSRCC 遥感区域变化理解基准数据集

Transfermarkt Football 足球转会数据集

MDPBench 多语言文档解析基准数据集

World Model Bench 世界模型基准数据集

相关数据集

MAKIEVAL 多语言文化知识评估数据集

RHELM 长程记忆评估数据集

SAM 3D Artist Objects 3D 物体重建数据集

FigureBench 科学插图生成基准数据集

ChartNet 图表理解多模态数据集

EAVSD 电商广告视频分镜数据集

World Air Pollution and AQI 全球空气质量与 AQI 数据集

SMOL 多语言翻译平行数据集

ViMU 视频隐喻理解数据集

Rice Leaf Diseases 水稻叶片病害检测数据集