HyperAIHyperAI

Command Palette

Search for a command to run...

Violinvideo- Und Sprachinferenz-Datensatz

Datum

vor 3 Jahren

Organisation

Carnegie Mellon Universität

Veröffentlichungs-URL

github.com

Paper-URL

arxiv.org

Lizenz

Andere

Treten Sie der Discord-Community bei
Featured Image

Violin steht für VIdeO-and-Language INference, was für multimodale Verständnisaufgaben von Videos und Texten verwendet werden kann.

Der Datensatz enthält 95.322 Video-Hypothesen-Paare aus 15.887 Videoclips, die mehr als 582 Stunden Video abdecken. Diese Videoclips enthalten reichhaltige Inhalte mit unterschiedlicher Zeitdynamik, Ereignisänderungen und zwischenmenschlichen Interaktionen. Die Daten wurden aus zwei Quellen gesammelt: (i) beliebten Fernsehsendungen und (ii) Filmclips von YouTube-Kanälen.

KI mit KI entwickeln

Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.

KI-Co-Coding
Sofort einsatzbereit GPUs
Beste Preise
Jetzt starten

Hyper Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
Violinvideo- Und Sprachinferenz-Datensatz | Datensätze | HyperAI