HyperAIHyperAI

Command Palette

Search for a command to run...

Soul-Bench オーディオ駆動型人間アニメーション評価データセット

日付

6ヶ月前

データセット構成

腾讯

論文URL

2512.13495

ライセンス

Non-Commercial

Soul-Bench は、2025 年に Tencent YouTu Lab によってリリースされた、オーディオ駆動型の人間アニメーション タスクの評価ベンチマークです。関連する研究論文には以下が含まれます... Soul: デジタルヒューマンに命を吹き込み、高忠実度の長期マルチモーダルアニメーションを実現目的は、実際のアプリケーション シナリオにおける関連手法の生成品質、一貫性、および一般化能力を体系的に評価することです。 このデータセットには 226 個のビデオ テスト サンプルが含まれており、以下のように複数の次元にわたって比較的豊富な分布を示しています。

  • 主な体型の分布
  • 上半身シーン:107
  • 全身シーン:72
  • 肖像画、アニメキャラクター、動物:47点
  • オーディオタイプの分布
  • 会話ベースの音声:177個
  • ボーカルパフォーマンス:49点
  • ビデオ解像度分布
  • 1080P: 118件
  • 720P: 55件
  • 4K: 51 アイテム
  • 480P: 2点
  • 画面の比率
  • 1 < r ≤ 2: 170 エントリ
  • r = 1(正方形):44行
  • 0.5 ≤ r < 1(垂直): 12行
  • 動画再生時間の分布
  • 27~30秒間隔:70行
    データセットの例
    データセットの例

引用

@misc{soul,
title={Soul: Breathe Life into Digital Human for High-fidelity Long-term Multimodal Animation},
author={Jiangning Zhang and Junwei Zhu and Zhenye Gan and Donghao Luo and Chuming Lin and Feifan Xu and Xu Peng and Jianlong Hu and Yuansen Liu and Yijia Hong and Weijian Cao and Han Feng and Xu Chen and Chencan Fu and Keke He and Xiaobin Hu and Chengjie Wang},
year={2025},
eprint={2512.13495},
archivePrefix={arXiv},
primaryClass={cs.CV},
url={https://arxiv.org/abs/2512.13495},
}

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています
Soul-Bench オーディオ駆動型人間アニメーション評価データセット | データセット | HyperAI超神経