日期

4 个月前

数据集组织

论文 URL

2510.01174

许可证

MIT

标签

代码生成

多模态

视频生成

MMMC 是由新加坡国立大学 Show Lab 于 2025 年发布的一个用于教学视频生成的大规模多学科教育视频生成基准数据集，相关论文成果为「Code2Video: A Code-centric Paradigm for Educational Video Generation」，旨在为教育类人工智能模型提供高质量的训练与评测资源，支持从结构化代码与教学内容自动生成专业教学视频的研究。

该数据集共包含 117 个完整教学视频，涵盖 13 个学科领域，包括微积分、几何、概率论和神经网络等。完整视频平均 1,014 秒（约 16.9 分钟），分段视频平均 201 秒（约 3.35 分钟）。数据来源于以教学影响力和精湛动画制作工艺闻名的 3Blue1Brown（3B1B）YouTube 教育视频库。 MMMC 的构建遵循两项标准：一是教育相关性，即每个主题均具教学价值；二是可执行支撑，每个概念均对应高质量的 Manim 参考，以确保内容可视化与复现性。

数据集结构

数据文件
- metadata.jsonl：包含每个视频实例的结构化信息的主要元数据文件。

每个条目 metadata.jsonl 包括：
- id：视频切片的唯一标识符。
- 类别：高级学科类别（例如，数学、物理、计算机科学）。
- 视频：相应教育视频片段的文件路径。
- main_topics：教学主题列表。
- num_slices：讲座分为的视频片段数。
- reference_image：与主题相关的关键参考图像（可选）。

该数据集由社区用户贡献，仅供交流学习使用。如内容涉及侵权，请联系邮箱 [email protected] 以便及时审查和下架。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

HyperAI

在 Discord 上讨论

日期

4 个月前

数据集组织

论文 URL

2510.01174

许可证

MIT

标签

代码生成

多模态

视频生成

数据集结构

数据文件
- metadata.jsonl：包含每个视频实例的结构化信息的主要元数据文件。

每个条目 metadata.jsonl 包括：
- id：视频切片的唯一标识符。
- 类别：高级学科类别（例如，数学、物理、计算机科学）。
- 视频：相应教育视频片段的文件路径。
- main_topics：教学主题列表。
- num_slices：讲座分为的视频片段数。
- reference_image：与主题相关的关键参考图像（可选）。

该数据集由社区用户贡献，仅供交流学习使用。如内容涉及侵权，请联系邮箱 [email protected] 以便及时审查和下架。

Nemotron-Personas-Brazil 巴西合成角色数据集

5 天前

AutoDock-GPU_Output 对接结果数据集

3 个月前

Diabetes Mexico 墨西哥糖尿病数据集

12 天前

VERA 语音推理评测数据集

3 个月前

2.37 GB59

X-Dance 图像驱动舞蹈动作数据集

2 个月前

147.3 MB75

VAP-Data 视觉动作表现数据集

2 个月前

Soul-Bench 音频驱动人体动画评测数据集

2 个月前

VenusBench-GD 跨平台界面理解数据集

1 个月前

Camera Clone 相机克隆多视角数据集

2 个月前

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

Command Palette

MMMC 教育视频生成基准数据集

数据集结构

用 AI 构建 AI

HyperAI Newsletters

Command Palette

MMMC 教育视频生成基准数据集

数据集结构

相关数据集

Nemotron-Personas-Brazil 巴西合成角色数据集

AutoDock-GPU_Output 对接结果数据集

Diabetes Mexico 墨西哥糖尿病数据集

VERA 语音推理评测数据集

X-Dance 图像驱动舞蹈动作数据集

VAP-Data 视觉动作表现数据集

Soul-Bench 音频驱动人体动画评测数据集

VenusBench-GD 跨平台界面理解数据集

Camera Clone 相机克隆多视角数据集

用 AI 构建 AI

HyperAI Newsletters

Command Palette

MMMC 教育视频生成基准数据集

数据集结构

相关数据集

Nemotron-Personas-Brazil 巴西合成角色数据集

AutoDock-GPU_Output 对接结果数据集

Diabetes Mexico 墨西哥糖尿病数据集

VERA 语音推理评测数据集

X-Dance 图像驱动舞蹈动作数据集

VAP-Data 视觉动作表现数据集

Soul-Bench 音频驱动人体动画评测数据集

VenusBench-GD 跨平台界面理解数据集

Camera Clone 相机克隆多视角数据集

用 AI 构建 AI

HyperAI Newsletters

相关数据集

Nemotron-Personas-Brazil 巴西合成角色数据集

AutoDock-GPU_Output 对接结果数据集

Diabetes Mexico 墨西哥糖尿病数据集

VERA 语音推理评测数据集

X-Dance 图像驱动舞蹈动作数据集

VAP-Data 视觉动作表现数据集

Soul-Bench 音频驱动人体动画评测数据集

VenusBench-GD 跨平台界面理解数据集

Camera Clone 相机克隆多视角数据集

相关数据集

Nemotron-Personas-Brazil 巴西合成角色数据集

AutoDock-GPU_Output 对接结果数据集

Diabetes Mexico 墨西哥糖尿病数据集

VERA 语音推理评测数据集

X-Dance 图像驱动舞蹈动作数据集

VAP-Data 视觉动作表现数据集

Soul-Bench 音频驱动人体动画评测数据集

VenusBench-GD 跨平台界面理解数据集

Camera Clone 相机克隆多视角数据集