Soul-Bench オーディオ駆動型人間アニメーション評価データセット
Soul-Bench は、2025 年に Tencent YouTu Lab によってリリースされた、オーディオ駆動型の人間アニメーション タスクの評価ベンチマークです。関連する研究論文には以下が含まれます... Soul: デジタルヒューマンに命を吹き込み、高忠実度の長期マルチモーダルアニメーションを実現目的は、実際のアプリケーション シナリオにおける関連手法の生成品質、一貫性、および一般化能力を体系的に評価することです。
このデータセットには 226 個のビデオ テスト サンプルが含まれており、以下のように複数の次元にわたって比較的豊富な分布を示しています。
- 主な体型の分布
- 上半身シーン:107
- 全身シーン:72
- 肖像画、アニメキャラクター、動物:47点
- オーディオタイプの分布
- 会話ベースの音声:177個
- ボーカルパフォーマンス:49点
- ビデオ解像度分布
- 1080P: 118件
- 720P: 55件
- 4K: 51 アイテム
- 480P: 2点
- 画面の比率
- 1 < r ≤ 2: 170 エントリ
- r = 1(正方形):44行
- 0.5 ≤ r < 1(垂直): 12行
- 動画再生時間の分布
- 27~30秒間隔:70行
