HyperAIHyperAI

Command Palette

Search for a command to run...

Soul-Bench 音频驱动人体动画评测数据集

日期

6 个月前

数据集组织

腾讯

论文 URL

2512.13495

许可证

Non-Commercial

Soul-Bench 是由腾讯优图实验室于 2025 年发布的一个面向音频驱动人体动画任务的评测基准,相关论文成果为 Soul: Breathe Life into Digital Human for High-fidelity Long-term Multimodal Animation,旨在系统评估相关方法在真实应用场景下的生成质量、一致性与泛化能力。 该数据集共包含 226 条视频测试样本,在多个维度上具有较为丰富的分布,具体如下:

  • 主体类型分布
  • 上半身场景:107 条
  • 全身场景:72 条
  • 人像、动画角色及动物:47 条
  • 音频类型分布
  • 对话类音频:177 条
  • 演唱类音频:49 条
  • 视频分辨率分布
  • 1080P:118 条
  • 720P:55 条
  • 4K:51 条
  • 480P:2 条
  • 画面比例分布
  • 1 < r ≤ 2:170 条
  • r = 1(正方形):44 条
  • 0.5 ≤ r < 1(纵向):12 条
  • 视频时长分布
  • 27–30 秒区间:70 条
    数据集示例
    数据集示例

Citation

@misc{soul,
title={Soul: Breathe Life into Digital Human for High-fidelity Long-term Multimodal Animation},
author={Jiangning Zhang and Junwei Zhu and Zhenye Gan and Donghao Luo and Chuming Lin and Feifan Xu and Xu Peng and Jianlong Hu and Yuansen Liu and Yijia Hong and Weijian Cao and Han Feng and Xu Chen and Chencan Fu and Keke He and Xiaobin Hu and Chengjie Wang},
year={2025},
eprint={2512.13495},
archivePrefix={arXiv},
primaryClass={cs.CV},
url={https://arxiv.org/abs/2512.13495},
}

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码
开箱即用的 GPU
最优定价

HyperAI Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供