HyperAIHyperAI

Command Palette

Search for a command to run...

StepEval Audio Paralinguistic Paralinguistic Understanding Evaluation Dataset

Date

vor 4 Monaten

Size

440.73 MB

Organization

StepFun

Paper URL

2507.16632

License

Apache 2.0

StepEval Audio Paralinguistic ist ein Datensatz zur Bewertung des paralinguistischen Audioverständnisses, der 2025 vom StepFun AI-Team veröffentlicht wurde. Das zugehörige Papier ist „Technischer Bericht zu Step-Audio 2“, dessen Ziel es ist, die Fähigkeit von KI-Modellen zu bewerten, paralinguistische Informationen (wie Geschlecht, Alter, Tonfall, Emotionen usw.) in der Sprache zu verstehen.

Dieser Datensatz besteht aus 550 Sprachproben, die gleichmäßig auf elf Aufgabendimensionen verteilt sind: Geschlecht, Alter, Klangfarbe, Emotion, Tonhöhe, Rhythmus, Geschwindigkeit, Sprechstil, Stimmaktivität, Szenario und Ereignistyp. Die ersten acht Aufgaben basieren auf chinesischen Audioclips aus 400 öffentlichen Podcasts, während die letzten drei Aufgaben jeweils 50 Audioproben aus AudioSet (Ereignisse), CochlScene (Umgebungsszenen) und VocalSound (Stimmgeräuscheffekte) verwenden. Alle Proben sind unter 30 Sekunden lang, gleichmäßig auf 24 kHz neu abgetastet und von einem professionellen Team kommentiert.

StepEval-Audio-Paralinguistic.torrent
Seeding 1Downloading 0Completed 19Total Downloads 91
  • StepEval-Audio-Paralinguistic/
    • README.md
      1.77 KB
    • README.txt
      3.54 KB
      • data/
        • StepEval-Audio-Paralinguistic.zip
          440.73 MB

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp