HyperAIHyperAI

Command Palette

Search for a command to run...

Console

Soul-Bench オーディオ駆動型人間アニメーション評価データセット

Discordで議論

日付

18時間前

組織

テンセント

論文URL

2512.13495

ライセンス

非営利

Soul-Bench は、2025 年に Tencent YouTu Lab によってリリースされた、オーディオ駆動型の人間アニメーション タスクの評価ベンチマークです。関連する研究論文には以下が含まれます... Soul: デジタルヒューマンに命を吹き込み、高忠実度の長期マルチモーダルアニメーションを実現目的は、実際のアプリケーション シナリオにおける関連手法の生成品質、一貫性、および一般化能力を体系的に評価することです。

このデータセットには 226 個のビデオ テスト サンプルが含まれており、以下のように複数の次元にわたって比較的豊富な分布を示しています。

  • 主な体型の分布
    • 上半身シーン:107
    • 全身シーン:72
    • 肖像画、アニメキャラクター、動物:47点
  • オーディオタイプの分布
    • 会話ベースの音声:177個
    • ボーカルパフォーマンス:49点
  • ビデオ解像度分布
    • 1080P: 118件
    • 720P: 55件
    • 4K: 51 アイテム
    • 480P: 2点
  • 画面の比率
    • 1 < r ≤ 2: 170 エントリ
    • r = 1(正方形):44行
    • 0.5 ≤ r < 1(垂直): 12行
  • 動画再生時間の分布
    • 27~30秒間隔:70行
データセットの例

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最適価格のGPUでAI開発を加速。

AI共同コーディング
すぐに利用可能な GPU
最適価格

Hyper Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています