Command Palette
Search for a command to run...
Ensemble De Données d'évaluation Du Raisonnement Vocal VERA
Date
Taille
URL de publication
URL du document
Licence
CC BY 4.0
VERA est un ensemble de données vocales multitâches à grande échelle, publié en 2025 par l'Université Duke en collaboration avec Adobe, conçu pour évaluer les capacités de raisonnement vocal natif. L'article de recherche associé s'intitule « Évaluation vocale des capacités de raisonnement : diagnostic de l’écart de performance induit par la modalitéL'objectif est d'évaluer la capacité de raisonnement de grands modèles dans des conditions vocales naturelles.
Cet ensemble de données contient 2 931 échantillons (épisodes) d’inférence de parole native, répartis en cinq pistes en fonction des caractéristiques de la tâche :
- Mathématiques (115 entrées) : Problèmes de mathématiques du concours AIME 2025
- Web (1 107 entrées) : Tâches de navigation Web et de recherche d’informations de BrowseComp
- Sciences (161 items) : Questions scientifiques de niveau supérieur basées sur GPQA Diamond.
- Textes longs (548 items) : Tâches de compréhension de textes longs en plusieurs tours issues du MRCR
- Factuel (1 000 entrées) : Questions et réponses factuelles basées sur SimpleQA.
Tous les échantillons sont présentés sous forme de parole native, l'audio étant synthétisé par Boson Higgs Audio 2 pour garantir une restitution vocale homogène, claire et de haute qualité. Le champ audio_file de chaque échantillon du jeu de données pointe vers le chemin d'accès audio correspondant.
Structures de données :
Les données sont organisées au format JSON et chaque épisode contient un échantillon complet d'inférence vocale. Ses principaux champs sont les suivants :
- id : Identifiant unique
- piste : La piste à laquelle elle appartient (raisonnement_mathématique / web / science / contexte_long / factuel)
- tours de dialogue : plusieurs tours de dialogue, comprenant :
- rôle (fixé à l'utilisateur)
- text_content (texte chiffré en Base64)
- fichier_audio (chemin_audio_correspondant)
- préfixe_texte et postfixe_texte (peuvent être vides)
- context_documents : Documents contextuels supplémentaires (le cas échéant)
- interruptions : journalisation des événements d'interruption
- metadata.expected_answer : La réponse de référence chiffrée
- canari : La clé de déchiffrement unique de cet échantillon.
Créer de l'IA avec l'IA
De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.