HyperAIHyperAI

Command Palette

Search for a command to run...

Console

WildSpeech-Bench Benchmark-Datensatz Zur Sprachverständnisgenerierung

Date

vor 2 Monaten

Size

169.51 MB

Organization

Tencent AI Lab
Tencent

Paper URL

2506.21875

License

CC BY 4.0

WildSpeech-Bench ist der erste Benchmark zur Bewertung der Speech-to-Speech-Fähigkeiten von SpeechLLM und wurde 2025 von Tencent veröffentlicht. Die Ergebnisse des zugehörigen Papiers lauten:WildSpeech-Bench: Benchmarking von End-to-End-SpeechLLMs in der Praxis“, dessen Ziel es ist, die Fähigkeit des Modells zu messen, in realen Szenarien der Sprachinteraktion vollständige Spracheingaben und Sprachausgaben (Speech-to-Speech, S2S) zu verstehen und zu generieren.

Der Datensatz enthält 1.100 Anfragen in fünf Hauptkategorien: Informationsanfragen, Lösungsanfragen, Meinungsaustausch, Texterstellung und paralinguistische Ausdrücke. Jede Kategorie entspricht einer gemeinsamen Nutzerabsicht. 1.000 dieser Anfragen stammen aus allgemeinen Szenarien der Sprachinteraktion (einschließlich Informationsanfragen, Lösungsanfragen, Meinungsaustausch und Texterstellung), während weitere 100 durch paralinguistische Merkmale wie Pausen, Intonation, Stottern und nahezu phonetische Worterkennung gekennzeichnet sind. Jede Anfrage wird von diversen Sprachausgabebeispielen begleitet, die ein breites Spektrum an Sprecherattributen (Geschlecht, Alter, Stimmvarianten), akustischen Bedingungen und Geräuschumgebungen abdecken, um die Vielfalt und die Herausforderungen der natürlichen Sprachinteraktion realistischer zu simulieren.

Prozess der Datensatzerstellung

WildSpeech-Bench.torrent
Seeding 2Downloading 0Completed 0Total Downloads 20
  • WildSpeech-Bench/
    • README.md
      1.83 KB
    • README.txt
      3.66 KB
      • data/
        • WildSpeech-Bench.zip
          169.51 MB

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

Hyper Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
WildSpeech-Bench Benchmark-Datensatz Zur Sprachverständnisgenerierung | Datasets | HyperAI