@misc{soul, title={Soul: Breathe Life into Digital Human for High-fidelity Long-term Multimodal Animation}, author={Jiangning Zhang and Junwei Zhu and Zhenye Gan and Donghao Luo and Chuming Lin and Feifan Xu and Xu Peng and Jianlong Hu and Yuansen Liu and Yijia Hong and Weijian Cao and Han Feng and Xu Chen and Chencan Fu and Keke He and Xiaobin Hu and Chengjie Wang}, year={2025}, eprint={2512.13495}, archivePrefix={arXiv}, primaryClass={cs.CV}, url={https://arxiv.org/abs/2512.13495}, }

日付

6ヶ月前

データセット構成

論文URL

2512.13495

ライセンス

Non-Commercial

タグ

動画生成

音声認識

Soul-Bench は、2025 年に Tencent YouTu Lab によってリリースされた、オーディオ駆動型の人間アニメーションタスクの評価ベンチマークです。関連する研究論文には以下が含まれます... Soul: デジタルヒューマンに命を吹き込み、高忠実度の長期マルチモーダルアニメーションを実現目的は、実際のアプリケーションシナリオにおける関連手法の生成品質、一貫性、および一般化能力を体系的に評価することです。このデータセットには 226 個のビデオテストサンプルが含まれており、以下のように複数の次元にわたって比較的豊富な分布を示しています。

主な体型の分布

上半身シーン：107
全身シーン：72
肖像画、アニメキャラクター、動物：47点

オーディオタイプの分布

会話ベースの音声：177個
ボーカルパフォーマンス：49点

ビデオ解像度分布

1080P: 118件
720P: 55件
4K: 51 アイテム
480P: 2点

画面の比率

1 < r ≤ 2: 170 エントリ
r = 1（正方形）：44行
0.5 ≤ r < 1（垂直）: 12行

動画再生時間の分布

27～30秒間隔：70行
データセットの例

引用

@misc{soul,
title={Soul: Breathe Life into Digital Human for High-fidelity Long-term Multimodal Animation},
author={Jiangning Zhang and Junwei Zhu and Zhenye Gan and Donghao Luo and Chuming Lin and Feifan Xu and Xu Peng and Jianlong Hu and Yuansen Liu and Yijia Hong and Weijian Cao and Han Feng and Xu Chen and Chencan Fu and Keke He and Xiaobin Hu and Chengjie Wang},
year={2025},
eprint={2512.13495},
archivePrefix={arXiv},
primaryClass={cs.CV},
url={https://arxiv.org/abs/2512.13495},
}

このデータセットはコミュニティユーザーによって提供されており、教育および情報提供のみを目的としています。著作権侵害に関わるコンテンツがある場合は、[email protected]までご連絡ください。速やかに確認し、削除いたします。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

HyperAI

このデータセットを使用 Discordで議論

日付

6ヶ月前

データセット構成

論文URL

2512.13495

ライセンス

Non-Commercial

タグ

動画生成

音声認識

主な体型の分布

上半身シーン：107
全身シーン：72
肖像画、アニメキャラクター、動物：47点

オーディオタイプの分布

会話ベースの音声：177個
ボーカルパフォーマンス：49点

ビデオ解像度分布

1080P: 118件
720P: 55件
4K: 51 アイテム
480P: 2点

画面の比率

1 < r ≤ 2: 170 エントリ
r = 1（正方形）：44行
0.5 ≤ r < 1（垂直）: 12行

動画再生時間の分布

27～30秒間隔：70行
データセットの例

引用

@misc{soul,
title={Soul: Breathe Life into Digital Human for High-fidelity Long-term Multimodal Animation},
author={Jiangning Zhang and Junwei Zhu and Zhenye Gan and Donghao Luo and Chuming Lin and Feifan Xu and Xu Peng and Jianlong Hu and Yuansen Liu and Yijia Hong and Weijian Cao and Han Feng and Xu Chen and Chencan Fu and Keke He and Xiaobin Hu and Chengjie Wang},
year={2025},
eprint={2512.13495},
archivePrefix={arXiv},
primaryClass={cs.CV},
url={https://arxiv.org/abs/2512.13495},
}

MAKIEVAL 多言語文化知識評価データセット

2時間前

逐語的スパンクエリ条件証拠抽出データセット

5時間後

RHELM長期記憶評価データセット

21時間前

SAM 3Dアーティストオブジェクト 3Dオブジェクト再構築データセット

2時間後

Nemotron-SFT-Math-v4 数学的推論SFTデータセット

2時間前

ChartNetチャートの理解：マルチモーダルデータセット

18日前

SMOL多言語翻訳並列データセット

19日前

chi-bench 医療インテリジェントエージェントベンチマーク評価データセット

6日前

MemLensマルチモーダル長コンテキストベンチマークデータセット

19日前

MathNetマルチモーダル数学ベンチマーク推論データセット

1ヶ月前

Claw-Eval実世界ベンチマークデータセット

1ヶ月前

眼底疾患分類データセット

1ヶ月前

RSRCCリモートセンシング領域変化理解ベンチマークデータセット

1日前

BRIGHT災害建物評価データセット

1日前

OmniParsingBench マルチモーダル構文解析機能評価データセット

1日前

ワールドモデルベンチデータセット

2ヶ月前

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

Command Palette

Soul-Bench オーディオ駆動型人間アニメーション評価データセット

引用

AIでAIを構築

HyperAI Newsletters

Command Palette

Soul-Bench オーディオ駆動型人間アニメーション評価データセット

引用

関連データセット

MAKIEVAL 多言語文化知識評価データセット

逐語的スパンクエリ条件証拠抽出データセット

RHELM長期記憶評価データセット

SAM 3Dアーティストオブジェクト 3Dオブジェクト再構築データセット

Nemotron-SFT-Math-v4 数学的推論SFTデータセット

ChartNetチャートの理解：マルチモーダルデータセット

SMOL多言語翻訳並列データセット

chi-bench 医療インテリジェントエージェントベンチマーク評価データセット

MemLensマルチモーダル長コンテキストベンチマークデータセット

MathNetマルチモーダル数学ベンチマーク推論データセット

Claw-Eval実世界ベンチマークデータセット

眼底疾患分類データセット

RSRCCリモートセンシング領域変化理解ベンチマークデータセット

BRIGHT災害建物評価データセット

OmniParsingBench マルチモーダル構文解析機能評価データセット

ワールドモデルベンチデータセット

AIでAIを構築

HyperAI Newsletters

Command Palette

Soul-Bench オーディオ駆動型人間アニメーション評価データセット

引用

関連データセット

MAKIEVAL 多言語文化知識評価データセット

逐語的スパンクエリ条件証拠抽出データセット

RHELM長期記憶評価データセット

SAM 3Dアーティストオブジェクト 3Dオブジェクト再構築データセット

Nemotron-SFT-Math-v4 数学的推論SFTデータセット

ChartNetチャートの理解：マルチモーダルデータセット

SMOL多言語翻訳並列データセット

chi-bench 医療インテリジェントエージェントベンチマーク評価データセット

MemLensマルチモーダル長コンテキストベンチマークデータセット

MathNetマルチモーダル数学ベンチマーク推論データセット

Claw-Eval実世界ベンチマークデータセット

眼底疾患分類データセット

RSRCCリモートセンシング領域変化理解ベンチマークデータセット

BRIGHT災害建物評価データセット

OmniParsingBench マルチモーダル構文解析機能評価データセット

ワールドモデルベンチデータセット

AIでAIを構築

HyperAI Newsletters

関連データセット

MAKIEVAL 多言語文化知識評価データセット

逐語的スパンクエリ条件証拠抽出データセット

RHELM長期記憶評価データセット

SAM 3Dアーティストオブジェクト 3Dオブジェクト再構築データセット

Nemotron-SFT-Math-v4 数学的推論SFTデータセット

ChartNetチャートの理解：マルチモーダルデータセット

SMOL多言語翻訳並列データセット

chi-bench 医療インテリジェントエージェントベンチマーク評価データセット

MemLensマルチモーダル長コンテキストベンチマークデータセット

MathNetマルチモーダル数学ベンチマーク推論データセット

Claw-Eval実世界ベンチマークデータセット

眼底疾患分類データセット

RSRCCリモートセンシング領域変化理解ベンチマークデータセット

BRIGHT災害建物評価データセット

OmniParsingBench マルチモーダル構文解析機能評価データセット

ワールドモデルベンチデータセット

関連データセット

MAKIEVAL 多言語文化知識評価データセット

逐語的スパンクエリ条件証拠抽出データセット

RHELM長期記憶評価データセット

SAM 3Dアーティストオブジェクト 3Dオブジェクト再構築データセット

Nemotron-SFT-Math-v4 数学的推論SFTデータセット

ChartNetチャートの理解：マルチモーダルデータセット

SMOL多言語翻訳並列データセット

chi-bench 医療インテリジェントエージェントベンチマーク評価データセット

MemLensマルチモーダル長コンテキストベンチマークデータセット

MathNetマルチモーダル数学ベンチマーク推論データセット

Claw-Eval実世界ベンチマークデータセット

眼底疾患分類データセット

RSRCCリモートセンシング領域変化理解ベンチマークデータセット