Datum

vor 4 Monaten

Größe

115.41 MB

Organisation

Paper-URL

2509.06155

Lizenz

Apache 2.0

Datenverteilung

Der Datensatz ist in drei Untergruppen (Set1-I, Set2-V und Set3-Ted) unterteilt und deckt verschiedene Audiokategorien ab, wie z. B. menschliche Stimmen, Tiergeräusche, Instrumentalmusik, Naturgeräusche, Geräusche aus der Mensch-Objekt-Interaktion, Objekteinschläge und mechanische Geräusche, die jeweils für unterschiedliche Szenarien und Inhaltstypen geeignet sind. Die spezifische Verteilung ist wie folgt:

Set 1-I enthält 205 Bild-Text-Paare, darunter KI-generierte Bilder, Web Scraping und Medien-Screenshots. Jedes Bild dient als visueller Input, und die entsprechenden Video-/Audio-Untertitel und Sprachinhalte werden durch ein großes Sprachmodell (LLM) und menschliche Annotation generiert.
Set2-V enthält 295 Beispiele kurzer Videoclips von YouTube und BiliBili, die mit von LLM generierten Untertiteln und mit Whisper zur automatischen Spracherkennung (ASR) transkribiertem Text versehen und manuell überprüft wurden.
Set3-Ted enthält TED-Talk-Videos vom September 2025 mit insgesamt 100 Beispielen, wobei der gleiche Annotationsprozess wie in Set2 verwendet wird.

Verse-Bench.torrent

Seeding 2Wird heruntergeladen 0Abgeschlossen 0Gesamtdownloads 54

Verse-Bench/
- README.md
  2.45 KB
- README.txt
  4.89 KB

Dieser Datensatz wurde von Community-Nutzern beigesteuert und dient ausschließlich Bildungs- und Informationszwecken. Falls Inhalte eine Urheberrechtsverletzung darstellen, kontaktieren Sie uns bitte unter [email protected] zur umgehenden Prüfung und Entfernung.

Verwandt Datensätze

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

Download

Auf Discord diskutieren

Datum

vor 4 Monaten

Größe

115.41 MB

Organisation

Paper-URL

2509.06155

Lizenz

Apache 2.0

Datenverteilung

Set 1-I enthält 205 Bild-Text-Paare, darunter KI-generierte Bilder, Web Scraping und Medien-Screenshots. Jedes Bild dient als visueller Input, und die entsprechenden Video-/Audio-Untertitel und Sprachinhalte werden durch ein großes Sprachmodell (LLM) und menschliche Annotation generiert.
Set2-V enthält 295 Beispiele kurzer Videoclips von YouTube und BiliBili, die mit von LLM generierten Untertiteln und mit Whisper zur automatischen Spracherkennung (ASR) transkribiertem Text versehen und manuell überprüft wurden.
Set3-Ted enthält TED-Talk-Videos vom September 2025 mit insgesamt 100 Beispielen, wobei der gleiche Annotationsprozess wie in Set2 verwendet wird.

Verse-Bench.torrent

Seeding 2Wird heruntergeladen 0Abgeschlossen 0Gesamtdownloads 54

Verse-Bench/
- README.md
  2.45 KB
- README.txt
  4.89 KB

Verwandt Datensätze

UNO-Bench Benchmark-Datensatz Für Die Vollständige Modalbewertung

vor 3 Monaten

9.71 GB69

OST-Bench Spatiotemporal Scene Understanding Benchmark Dataset

vor 3 Monaten

25.58 GB60

IF-Bench Infrarot-Bildverständnis-Benchmark-Datensatz

vor 2 Monaten

CL-bench Kontextlern-Evaluierungsbenchmark

vor 3 Tagen

Soul-Bench Audio-Driven Human Animation Evaluation Dataset

vor 2 Monaten

EditReward-Bench Bildbearbeitungs-Evaluierungsdatensatz

vor 3 Monaten

5.08 GB61

PhysToolBench Physik-Tool-Aufgabendatensatz

vor 2 Monaten

1.56 GB55

MeshCoder: Strukturierter 3D-Objektcode-Datensatz

vor 2 Monaten

MMSVGBench Multimodal Vector Graphics Generation Benchmark Dataset

vor 2 Monaten

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

Command Palette

Verse-Bench-Datensatz Zur Gemeinsamen Audiovisuellen Generierung

Datenverteilung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

Verse-Bench-Datensatz Zur Gemeinsamen Audiovisuellen Generierung

Datenverteilung

Verwandt Datensätze

UNO-Bench Benchmark-Datensatz Für Die Vollständige Modalbewertung

OST-Bench Spatiotemporal Scene Understanding Benchmark Dataset

IF-Bench Infrarot-Bildverständnis-Benchmark-Datensatz

CL-bench Kontextlern-Evaluierungsbenchmark

Soul-Bench Audio-Driven Human Animation Evaluation Dataset

EditReward-Bench Bildbearbeitungs-Evaluierungsdatensatz

PhysToolBench Physik-Tool-Aufgabendatensatz

MeshCoder: Strukturierter 3D-Objektcode-Datensatz

MMSVGBench Multimodal Vector Graphics Generation Benchmark Dataset

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

Verse-Bench-Datensatz Zur Gemeinsamen Audiovisuellen Generierung

Datenverteilung

Verwandt Datensätze

UNO-Bench Benchmark-Datensatz Für Die Vollständige Modalbewertung

OST-Bench Spatiotemporal Scene Understanding Benchmark Dataset

IF-Bench Infrarot-Bildverständnis-Benchmark-Datensatz

CL-bench Kontextlern-Evaluierungsbenchmark

Soul-Bench Audio-Driven Human Animation Evaluation Dataset

EditReward-Bench Bildbearbeitungs-Evaluierungsdatensatz

PhysToolBench Physik-Tool-Aufgabendatensatz

MeshCoder: Strukturierter 3D-Objektcode-Datensatz

MMSVGBench Multimodal Vector Graphics Generation Benchmark Dataset

KI mit KI entwickeln

HyperAI Newsletters

Verwandt Datensätze

UNO-Bench Benchmark-Datensatz Für Die Vollständige Modalbewertung

OST-Bench Spatiotemporal Scene Understanding Benchmark Dataset

IF-Bench Infrarot-Bildverständnis-Benchmark-Datensatz

CL-bench Kontextlern-Evaluierungsbenchmark

Soul-Bench Audio-Driven Human Animation Evaluation Dataset

EditReward-Bench Bildbearbeitungs-Evaluierungsdatensatz

PhysToolBench Physik-Tool-Aufgabendatensatz

MeshCoder: Strukturierter 3D-Objektcode-Datensatz

MMSVGBench Multimodal Vector Graphics Generation Benchmark Dataset

Verwandt Datensätze

UNO-Bench Benchmark-Datensatz Für Die Vollständige Modalbewertung

OST-Bench Spatiotemporal Scene Understanding Benchmark Dataset

IF-Bench Infrarot-Bildverständnis-Benchmark-Datensatz

CL-bench Kontextlern-Evaluierungsbenchmark

Soul-Bench Audio-Driven Human Animation Evaluation Dataset

EditReward-Bench Bildbearbeitungs-Evaluierungsdatensatz

PhysToolBench Physik-Tool-Aufgabendatensatz

MeshCoder: Strukturierter 3D-Objektcode-Datensatz

MMSVGBench Multimodal Vector Graphics Generation Benchmark Dataset