Soul-Bench Audio-Driven Human Animation Evaluation Dataset
Datum
Paper-URL
Lizenz
Nicht-kommerziell
Soul-Bench ist ein Evaluierungs-Benchmark für audiobasierte Animationsaufgaben, der 2025 von Tencent YouTu Lab veröffentlicht wurde. Zugehörige Forschungsarbeiten umfassen... Soul: Erwecke digitale Menschen zum Leben für hochauflösende, langfristige multimodale Animationen.Ziel ist es, die Generierungsqualität, Konsistenz und Generalisierungsfähigkeit relevanter Methoden in realen Anwendungsszenarien systematisch zu bewerten.
Dieser Datensatz enthält 226 Video-Testbeispiele, die eine relativ breite Verteilung über mehrere Dimensionen aufweisen, wie nachfolgend detailliert beschrieben:
- Hauptkörper-Typenverteilung
- Szenen mit dem Oberkörper: 107
- Ganzkörperszenen: 72
- Porträts, Zeichentrickfiguren und Tiere: 47 Artikel
- Audio-Typverteilung
- Dialogbasiertes Audio: 177 Stücke
- Gesangsdarbietungen: 49 Einträge
- Videoauflösungsverteilung
- 1080p: 118 Artikel
- 720p: 55 Artikel
- 4K: 51 Artikel
- 480P: 2 Artikel
- Bildschirmproportionen
- 1 < r ≤ 2: 170 Einträge
- r = 1 (Quadrat): 44 Zeilen
- 0,5 ≤ r < 1 (vertikal): 12 Zeilen
- Videodauerverteilung
- Intervall von 27–30 Sekunden: 70 Zeilen

KI mit KI entwickeln
Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.