Command Palette
Search for a command to run...
StepEval Audio Paralinguistic Paralinguistic Understanding Evaluation Dataset
Datum
Größe
Paper-URL
Lizenz
Apache 2.0
StepEval Audio Paralinguistic ist ein Datensatz zur Bewertung des paralinguistischen Audioverständnisses, der 2025 vom StepFun AI-Team veröffentlicht wurde. Das zugehörige Papier ist „Technischer Bericht zu Step-Audio 2“, dessen Ziel es ist, die Fähigkeit von KI-Modellen zu bewerten, paralinguistische Informationen (wie Geschlecht, Alter, Tonfall, Emotionen usw.) in der Sprache zu verstehen.
Dieser Datensatz besteht aus 550 Sprachproben, die gleichmäßig auf elf Aufgabendimensionen verteilt sind: Geschlecht, Alter, Klangfarbe, Emotion, Tonhöhe, Rhythmus, Geschwindigkeit, Sprechstil, Stimmaktivität, Szenario und Ereignistyp. Die ersten acht Aufgaben basieren auf chinesischen Audioclips aus 400 öffentlichen Podcasts, während die letzten drei Aufgaben jeweils 50 Audioproben aus AudioSet (Ereignisse), CochlScene (Umgebungsszenen) und VocalSound (Stimmgeräuscheffekte) verwenden. Alle Proben sind unter 30 Sekunden lang, gleichmäßig auf 24 kHz neu abgetastet und von einem professionellen Team kommentiert.
KI mit KI entwickeln
Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.