@misc{soul, title={Soul: Breathe Life into Digital Human for High-fidelity Long-term Multimodal Animation}, author={Jiangning Zhang and Junwei Zhu and Zhenye Gan and Donghao Luo and Chuming Lin and Feifan Xu and Xu Peng and Jianlong Hu and Yuansen Liu and Yijia Hong and Weijian Cao and Han Feng and Xu Chen and Chencan Fu and Keke He and Xiaobin Hu and Chengjie Wang}, year={2025}, eprint={2512.13495}, archivePrefix={arXiv}, primaryClass={cs.CV}, url={https://arxiv.org/abs/2512.13495}, }

日期

6 个月前

数据集组织

论文 URL

2512.13495

许可证

Non-Commercial

标签

视频生成

音频识别

Soul-Bench 是由腾讯优图实验室于 2025 年发布的一个面向音频驱动人体动画任务的评测基准，相关论文成果为 Soul: Breathe Life into Digital Human for High-fidelity Long-term Multimodal Animation，旨在系统评估相关方法在真实应用场景下的生成质量、一致性与泛化能力。该数据集共包含 226 条视频测试样本，在多个维度上具有较为丰富的分布，具体如下：

主体类型分布

上半身场景：107 条
全身场景：72 条
人像、动画角色及动物：47 条

音频类型分布

对话类音频：177 条
演唱类音频：49 条

视频分辨率分布

1080P：118 条
720P：55 条
4K：51 条
480P：2 条

画面比例分布

1 < r ≤ 2：170 条
r = 1（正方形）：44 条
0.5 ≤ r < 1（纵向）：12 条

视频时长分布

27–30 秒区间：70 条
数据集示例

Citation

@misc{soul,
title={Soul: Breathe Life into Digital Human for High-fidelity Long-term Multimodal Animation},
author={Jiangning Zhang and Junwei Zhu and Zhenye Gan and Donghao Luo and Chuming Lin and Feifan Xu and Xu Peng and Jianlong Hu and Yuansen Liu and Yijia Hong and Weijian Cao and Han Feng and Xu Chen and Chencan Fu and Keke He and Xiaobin Hu and Chengjie Wang},
year={2025},
eprint={2512.13495},
archivePrefix={arXiv},
primaryClass={cs.CV},
url={https://arxiv.org/abs/2512.13495},
}

此数据集由社区用户贡献,仅用于教育和信息目的。如有任何内容涉及版权侵权,请通过 [email protected] 联系我们,我们将及时审核并删除。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

HyperAI

使用此数据集在 Discord 上讨论

日期

6 个月前

数据集组织

论文 URL

2512.13495

许可证

Non-Commercial

标签

视频生成

音频识别

主体类型分布

上半身场景：107 条
全身场景：72 条
人像、动画角色及动物：47 条

音频类型分布

对话类音频：177 条
演唱类音频：49 条

视频分辨率分布

1080P：118 条
720P：55 条
4K：51 条
480P：2 条

画面比例分布

1 < r ≤ 2：170 条
r = 1（正方形）：44 条
0.5 ≤ r < 1（纵向）：12 条

视频时长分布

27–30 秒区间：70 条
数据集示例

Citation

@misc{soul,
title={Soul: Breathe Life into Digital Human for High-fidelity Long-term Multimodal Animation},
author={Jiangning Zhang and Junwei Zhu and Zhenye Gan and Donghao Luo and Chuming Lin and Feifan Xu and Xu Peng and Jianlong Hu and Yuansen Liu and Yijia Hong and Weijian Cao and Han Feng and Xu Chen and Chencan Fu and Keke He and Xiaobin Hu and Chengjie Wang},
year={2025},
eprint={2512.13495},
archivePrefix={arXiv},
primaryClass={cs.CV},
url={https://arxiv.org/abs/2512.13495},
}

此数据集由社区用户贡献,仅用于教育和信息目的。如有任何内容涉及版权侵权,请通过 [email protected] 联系我们,我们将及时审核并删除。

MAKIEVAL 多语言文化知识评估数据集

3 小时前

Verbatim Spans 查询条件证据提取数据集

4 小时内

RHELM 长程记忆评估数据集

1 天前

SAM 3D Artist Objects 3D 物体重建数据集

1 小时内

Nemotron-SFT-Math-v4 数学推理 SFT 数据集

3 小时前

ChartNet 图表理解多模态数据集

18 天前

SMOL 多语言翻译平行数据集

19 天前

chi-bench 医疗智能体基准评测数据集

6 天前

MemLens 多模态长上下文基准数据集

19 天前

MathNet 多模态数学基准推理数据集

1 个月前

Claw-Eval 真实世界评测基准数据集

1 个月前

Eye Disease Classification Fundus 眼底疾病分类数据集

1 个月前

RSRCC 遥感区域变化理解基准数据集

1 天前

BRIGHT 灾害建筑评估数据集

1 天前

OmniParsingBench 多模态解析能力评估数据集

1 天前

World Model Bench 世界模型基准数据集

2 个月前

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

Command Palette

Soul-Bench 音频驱动人体动画评测数据集

Citation

用 AI 构建 AI

HyperAI Newsletters

Command Palette

Soul-Bench 音频驱动人体动画评测数据集

Citation

相关数据集

MAKIEVAL 多语言文化知识评估数据集

Verbatim Spans 查询条件证据提取数据集

RHELM 长程记忆评估数据集

SAM 3D Artist Objects 3D 物体重建数据集

Nemotron-SFT-Math-v4 数学推理 SFT 数据集

ChartNet 图表理解多模态数据集

SMOL 多语言翻译平行数据集

chi-bench 医疗智能体基准评测数据集

MemLens 多模态长上下文基准数据集

MathNet 多模态数学基准推理数据集

Claw-Eval 真实世界评测基准数据集

Eye Disease Classification Fundus 眼底疾病分类数据集

RSRCC 遥感区域变化理解基准数据集

BRIGHT 灾害建筑评估数据集

OmniParsingBench 多模态解析能力评估数据集

World Model Bench 世界模型基准数据集

用 AI 构建 AI

HyperAI Newsletters

Command Palette

Soul-Bench 音频驱动人体动画评测数据集

Citation

相关数据集

MAKIEVAL 多语言文化知识评估数据集

Verbatim Spans 查询条件证据提取数据集

RHELM 长程记忆评估数据集

SAM 3D Artist Objects 3D 物体重建数据集

Nemotron-SFT-Math-v4 数学推理 SFT 数据集

ChartNet 图表理解多模态数据集

SMOL 多语言翻译平行数据集

chi-bench 医疗智能体基准评测数据集

MemLens 多模态长上下文基准数据集

MathNet 多模态数学基准推理数据集

Claw-Eval 真实世界评测基准数据集

Eye Disease Classification Fundus 眼底疾病分类数据集

RSRCC 遥感区域变化理解基准数据集

BRIGHT 灾害建筑评估数据集

OmniParsingBench 多模态解析能力评估数据集

World Model Bench 世界模型基准数据集

用 AI 构建 AI

HyperAI Newsletters

相关数据集

MAKIEVAL 多语言文化知识评估数据集

Verbatim Spans 查询条件证据提取数据集

RHELM 长程记忆评估数据集

SAM 3D Artist Objects 3D 物体重建数据集

Nemotron-SFT-Math-v4 数学推理 SFT 数据集

ChartNet 图表理解多模态数据集

SMOL 多语言翻译平行数据集

chi-bench 医疗智能体基准评测数据集

MemLens 多模态长上下文基准数据集

MathNet 多模态数学基准推理数据集

Claw-Eval 真实世界评测基准数据集

Eye Disease Classification Fundus 眼底疾病分类数据集

RSRCC 遥感区域变化理解基准数据集

BRIGHT 灾害建筑评估数据集

OmniParsingBench 多模态解析能力评估数据集

World Model Bench 世界模型基准数据集

相关数据集

MAKIEVAL 多语言文化知识评估数据集

Verbatim Spans 查询条件证据提取数据集

RHELM 长程记忆评估数据集

SAM 3D Artist Objects 3D 物体重建数据集

Nemotron-SFT-Math-v4 数学推理 SFT 数据集

ChartNet 图表理解多模态数据集

SMOL 多语言翻译平行数据集

chi-bench 医疗智能体基准评测数据集

MemLens 多模态长上下文基准数据集

MathNet 多模态数学基准推理数据集

Claw-Eval 真实世界评测基准数据集

Eye Disease Classification Fundus 眼底疾病分类数据集

RSRCC 遥感区域变化理解基准数据集