Date

il y a un an

Taille

120.7 MB

Organisation

URL de publication

github.com

URL du document

openreview.net

Licence

CC BY 4.0

Balises

Reconnaissance Vocale

Classification Audio

L'ensemble de données a été publié en 2024 par des chercheurs de la Northwestern Polytechnical University, de Xi'an Lianfeng Acoustic Technology Co., Ltd., de la Nanyang Technological University, de l'Université de Surrey et de l'Institut d'acoustique de l'Académie chinoise des sciences.AudioSetCaps : génération d'ensembles de données de sous-titrage audio enrichis à l'aide de grands modèles de langage audio", a été accepté par NeurIPS 24. AudioSetCaps est un ensemble de données de sous-titres audio contenant 6 117 099 fichiers audio de 10 secondes. Chaque fichier audio est accompagné d'un titre descriptif et de 3 paires de questions-réponses comme métadonnées pour générer le titre final (un total de 18 414 789 paires de données de questions-réponses). Il est créé à l'aide d'un pipeline de génération automatisé de grands modèles audio et linguistiques utilisant des données provenant de trois ensembles de données audio : AudioSet, YouTube-8M et VGGSound.

AudioSetCaps.torrent

Seeding 2Téléchargement 0Terminé 125Total Downloads 258

AudioSetCaps/
- README.md
  1.63 KB
- README.txt
  3.27 KB

Ce jeu de données est fourni par les utilisateurs de la communauté et est destiné uniquement à des fins éducatives et informatives. Si un contenu enfreint des droits d'auteur, veuillez nous contacter à [email protected] pour examen et retrait rapides.

undefined

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

Utiliser ce jeu de données

Discuter sur Discord

Date

il y a un an

Taille

120.7 MB

Organisation

URL de publication

github.com

URL du document

openreview.net

Licence

CC BY 4.0

Balises

Reconnaissance Vocale

Classification Audio

AudioSetCaps.torrent

Seeding 2Téléchargement 0Terminé 125Total Downloads 258

AudioSetCaps/
- README.md
  1.63 KB
- README.txt
  3.27 KB

undefined

Ensemble De Données Groundsource Sur Les Événements d'inondation Mondiaux

il y a 2 mois

Ensemble De Données De Tâches Génératives multi-domaines RubricHub_v1

il y a 3 mois

Ensemble De Données De Génération Vidéo De Robot RoVid-X

il y a un mois

Ensemble De Données De Transcription De Texte LightOnOCR-mix-0126

il y a 3 mois

Ensemble De Données d'inférence Multitâche TxT360-3efforts

il y a 4 mois

Ensemble De Données De Détection De Contrebande Par Rayons X

il y a 4 mois

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

Command Palette

Ensemble De Données De sous-titres Audio AudioSetCaps

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Ensemble De Données De sous-titres Audio AudioSetCaps

undefined

Ensemble De Données Groundsource Sur Les Événements d'inondation Mondiaux

Ensemble De Données De Tâches Génératives multi-domaines RubricHub_v1

Ensemble De Données De Génération Vidéo De Robot RoVid-X

Ensemble De Données De Transcription De Texte LightOnOCR-mix-0126

Ensemble De Données d'inférence Multitâche TxT360-3efforts

Ensemble De Données De Détection De Contrebande Par Rayons X

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Ensemble De Données De sous-titres Audio AudioSetCaps

undefined

Ensemble De Données Groundsource Sur Les Événements d'inondation Mondiaux

Ensemble De Données De Tâches Génératives multi-domaines RubricHub_v1

Ensemble De Données De Génération Vidéo De Robot RoVid-X

Ensemble De Données De Transcription De Texte LightOnOCR-mix-0126

Ensemble De Données d'inférence Multitâche TxT360-3efforts

Ensemble De Données De Détection De Contrebande Par Rayons X

Créer de l'IA avec l'IA

HyperAI Newsletters

undefined

Ensemble De Données Groundsource Sur Les Événements d'inondation Mondiaux

Ensemble De Données De Tâches Génératives multi-domaines RubricHub_v1

Ensemble De Données De Génération Vidéo De Robot RoVid-X

Ensemble De Données De Transcription De Texte LightOnOCR-mix-0126

Ensemble De Données d'inférence Multitâche TxT360-3efforts

Ensemble De Données De Détection De Contrebande Par Rayons X

undefined

Ensemble De Données Groundsource Sur Les Événements d'inondation Mondiaux

Ensemble De Données De Tâches Génératives multi-domaines RubricHub_v1

Ensemble De Données De Génération Vidéo De Robot RoVid-X

Ensemble De Données De Transcription De Texte LightOnOCR-mix-0126

Ensemble De Données d'inférence Multitâche TxT360-3efforts

Ensemble De Données De Détection De Contrebande Par Rayons X