HyperAIHyperAI

Command Palette

Search for a command to run...

AudioSetCaps Audio-Untertitel-Datensatz

Date

vor einem Jahr

Size

120.7 MB

Organization

Nanyang Technologische Universität
Northwestern Polytechnical University
Universität von Surrey

Publish URL

github.com

License

CC BY 4.0

Der Datensatz wurde 2024 von Forschern der Northwestern Polytechnical University, der Xi'an Lianfeng Acoustic Technology Co., Ltd., der Nanyang Technological University, der University of Surrey und dem Institute of Acoustics der Chinesischen Akademie der Wissenschaften veröffentlicht.AudioSetCaps: Generierung erweiterter Datensätze für Audiountertitel mithilfe großer Audiosprachenmodelle", wurde von NeurIPS 24 akzeptiert.

AudioSetCaps ist ein Audio-Untertitel-Datensatz mit 6.117.099 10-Sekunden-Audiodateien. Jede Audiodatei wird von einem beschreibenden Titel und 3 Frage-und-Antwort-Paaren als Metadaten begleitet, um den endgültigen Titel zu generieren (insgesamt 18.414.789 Frage-und-Antwort-Datenpaare).

Es wird mithilfe einer automatisierten Generierungspipeline großer Audio- und Sprachmodelle erstellt, die Daten aus drei Audiodatensätzen verwendet: AudioSet, YouTube-8M und VGGSound.

AudioSetCaps.torrent
Seeding 1Downloading 0Completed 109Total Downloads 207
  • AudioSetCaps/
    • README.md
      1.63 KB
    • README.txt
      3.27 KB
      • data/
        • AudioSetCaps.zip
          120.7 MB

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp