Command Palette
Search for a command to run...
Ensemble De Données Textuelles De Conversation Audio AF-Chat
Date
Taille
URL de l'article
AF-Chat est un ensemble de données textuelles de conversation audio publié par NVIDIA en 2025. Les résultats de l'article associé sont «Audio Flamingo 3 : Optimisation de l'intelligence audio grâce à des modèles de langage audio entièrement ouverts et volumineux", qui vise à former et à évaluer des modèles de génération de dialogue.
L'ensemble de données contient environ 75 000 dialogues multi-tours et multi-audio (en moyenne 4,6 segments et 6,2 tours ; entre 2 et 8 segments et 2 à 10 tours), couvrant la parole, les sons environnementaux et la musique. L'ensemble de données est divisé en différents sous-ensembles (son, musique 4ALL, millions de chansons) selon la source de chaque audio. Seules les annotations textuelles de type questions-réponses sont fournies, et non les fichiers audio eux-mêmes.
Construire l'IA avec l'IA
De l'idée au lancement — accélérez votre développement IA avec du co-codage IA gratuit, un environnement prêt à l'emploi et les meilleurs prix GPU.