Datum

vor 4 Jahren

Größe

7.88 GB

Organisation

Veröffentlichungs-URL

antoyang.github.io

Paper-URL

arxiv.org

Lizenz

Other

Tags

Videobegreifen

Visuelle Fragebeantwortung

Bildverstehen

Multimodale Darstellung

VQA steht für Visual Question Answering (visuelles Fragen-Beantworten). HowToVQA69M ist ein Datensatz mit Antworten auf Videofragen, der 69.270.581 Fragen und Antworten enthält. Sein Umfang ist doppelt so groß wie der des vorhandenen Datensatzes zur Beantwortung von Videofragen und -fragen VideoQA. Im Durchschnitt entstehen aus jedem Rohvideo 43 Videoclips mit einer Länge von jeweils 12,1 Sekunden und 1,2 Fragen und Antworten, wobei die Fragen 8,7 Wörter und die Antworten 2,4 Wörter umfassen. Der HowToVQA69M-Datensatz ist sehr vielfältig und enthält mehr als 16 Millionen eindeutige Antworten, von denen mehr als 2 Millionen eindeutige Antworten mehr als einmal und mehr als 300.000 eindeutige Antworten mehr als 10 Mal vorkommen.

HowToVQA69M.torrent

Seeding 2Wird heruntergeladen 0Abgeschlossen 686Gesamtdownloads 635

HowToVQA69M/
- README.md
  1.23 KB
- README.txt
  2.47 KB

Dieser Datensatz wurde von Community-Nutzern beigesteuert und dient ausschließlich Bildungs- und Informationszwecken. Falls Inhalte eine Urheberrechtsverletzung darstellen, kontaktieren Sie uns bitte unter [email protected] zur umgehenden Prüfung und Entfernung.

Zugehörige Datensätze

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

Diesen Datensatz verwenden

Auf Discord diskutieren

Datum

vor 4 Jahren

Größe

7.88 GB

Organisation

Veröffentlichungs-URL

antoyang.github.io

Paper-URL

arxiv.org

Lizenz

Other

Zugehörige Datensätze

CHOCLO Lateinamerikanischer Kultur-Benchmark-Datensatz

vor 2 Monaten

Open-RL Inferenzproblem-Datensatz

vor 4 Monaten

THINGS-EEG EEG-Datensatz

vor 5 Monaten

Datensatz Menschlicher Gesichtsausdrücke

vor 2 Monaten

GroundingME-Datensatz Zur Evaluierung Des Verständnisses Komplexer Szenen

vor 6 Monaten

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

Command Palette

HowToVQA69M-Datensatz Zur Beantwortung Von Videofragen

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

HowToVQA69M-Datensatz Zur Beantwortung Von Videofragen

Zugehörige Datensätze

CHOCLO Lateinamerikanischer Kultur-Benchmark-Datensatz

Open-RL Inferenzproblem-Datensatz

THINGS-EEG EEG-Datensatz

Datensatz Menschlicher Gesichtsausdrücke

GroundingME-Datensatz Zur Evaluierung Des Verständnisses Komplexer Szenen

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

HowToVQA69M-Datensatz Zur Beantwortung Von Videofragen

Zugehörige Datensätze

CHOCLO Lateinamerikanischer Kultur-Benchmark-Datensatz

Open-RL Inferenzproblem-Datensatz

THINGS-EEG EEG-Datensatz

Datensatz Menschlicher Gesichtsausdrücke

GroundingME-Datensatz Zur Evaluierung Des Verständnisses Komplexer Szenen

KI mit KI entwickeln

HyperAI Newsletters

Zugehörige Datensätze

CHOCLO Lateinamerikanischer Kultur-Benchmark-Datensatz

Open-RL Inferenzproblem-Datensatz

THINGS-EEG EEG-Datensatz

Datensatz Menschlicher Gesichtsausdrücke

GroundingME-Datensatz Zur Evaluierung Des Verständnisses Komplexer Szenen

Zugehörige Datensätze

CHOCLO Lateinamerikanischer Kultur-Benchmark-Datensatz

Open-RL Inferenzproblem-Datensatz

THINGS-EEG EEG-Datensatz

Datensatz Menschlicher Gesichtsausdrücke

GroundingME-Datensatz Zur Evaluierung Des Verständnisses Komplexer Szenen