Datum

vor 2 Jahren

Größe

120.7 MB

Organisation

Veröffentlichungs-URL

github.com

Paper-URL

openreview.net

Lizenz

CC BY 4.0

Tags

Spracherkennung

Audio-Klassifikation

Der Datensatz wurde 2024 von Forschern der Northwestern Polytechnical University, der Xi'an Lianfeng Acoustic Technology Co., Ltd., der Nanyang Technological University, der University of Surrey und dem Institute of Acoustics der Chinesischen Akademie der Wissenschaften veröffentlicht.AudioSetCaps: Generierung erweiterter Datensätze für Audiountertitel mithilfe großer Audiosprachenmodelle", wurde von NeurIPS 24 akzeptiert. AudioSetCaps ist ein Audio-Untertitel-Datensatz mit 6.117.099 10-Sekunden-Audiodateien. Jede Audiodatei wird von einem beschreibenden Titel und 3 Frage-und-Antwort-Paaren als Metadaten begleitet, um den endgültigen Titel zu generieren (insgesamt 18.414.789 Frage-und-Antwort-Datenpaare). Es wird mithilfe einer automatisierten Generierungspipeline großer Audio- und Sprachmodelle erstellt, die Daten aus drei Audiodatensätzen verwendet: AudioSet, YouTube-8M und VGGSound.

AudioSetCaps.torrent

Seeding 2Wird heruntergeladen 0Abgeschlossen 125Gesamtdownloads 258

AudioSetCaps/
- README.md
  1.63 KB
- README.txt
  3.27 KB

Dieser Datensatz wurde von Community-Nutzern beigesteuert und dient ausschließlich Bildungs- und Informationszwecken. Falls Inhalte eine Urheberrechtsverletzung darstellen, kontaktieren Sie uns bitte unter [email protected] zur umgehenden Prüfung und Entfernung.

Zugehörige Datensätze

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

Diesen Datensatz verwenden

Auf Discord diskutieren

Datum

vor 2 Jahren

Größe

120.7 MB

Organisation

Veröffentlichungs-URL

github.com

Paper-URL

openreview.net

Lizenz

CC BY 4.0

Zugehörige Datensätze

Groundsource Global Flood Events Dataset

vor 3 Monaten

RubricHub_v1 Multi-Domain Generative Task Dataset

vor 5 Monaten

RoVid-X-Roboter-Videogenerierungsdatensatz

vor 2 Monaten

LightOnOCR-mix-0126 Texttranskriptionsdatensatz

vor 5 Monaten

TxT360-3efforts Multi-Task Inference Dataset

vor 6 Monaten

Datensatz Zur Röntgen-Schmuggelware-Erkennung

vor 6 Monaten

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

Command Palette

AudioSetCaps Audio-Untertitel-Datensatz

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

AudioSetCaps Audio-Untertitel-Datensatz

Zugehörige Datensätze

Groundsource Global Flood Events Dataset

RubricHub_v1 Multi-Domain Generative Task Dataset

RoVid-X-Roboter-Videogenerierungsdatensatz

LightOnOCR-mix-0126 Texttranskriptionsdatensatz

TxT360-3efforts Multi-Task Inference Dataset

Datensatz Zur Röntgen-Schmuggelware-Erkennung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

AudioSetCaps Audio-Untertitel-Datensatz

Zugehörige Datensätze

Groundsource Global Flood Events Dataset

RubricHub_v1 Multi-Domain Generative Task Dataset

RoVid-X-Roboter-Videogenerierungsdatensatz

LightOnOCR-mix-0126 Texttranskriptionsdatensatz

TxT360-3efforts Multi-Task Inference Dataset

Datensatz Zur Röntgen-Schmuggelware-Erkennung

KI mit KI entwickeln

HyperAI Newsletters

Zugehörige Datensätze

Groundsource Global Flood Events Dataset

RubricHub_v1 Multi-Domain Generative Task Dataset

RoVid-X-Roboter-Videogenerierungsdatensatz

LightOnOCR-mix-0126 Texttranskriptionsdatensatz

TxT360-3efforts Multi-Task Inference Dataset

Datensatz Zur Röntgen-Schmuggelware-Erkennung

Zugehörige Datensätze

Groundsource Global Flood Events Dataset

RubricHub_v1 Multi-Domain Generative Task Dataset

RoVid-X-Roboter-Videogenerierungsdatensatz

LightOnOCR-mix-0126 Texttranskriptionsdatensatz

TxT360-3efforts Multi-Task Inference Dataset

Datensatz Zur Röntgen-Schmuggelware-Erkennung