Datum

vor 4 Jahren

Organisation

Veröffentlichungs-URL

davar-lab.github.io

Paper-URL

arxiv.org

Lizenz

Other

Tags

Videobegreifen

Visuelle Fragebeantwortung

Bildverstehen

Multimodale Darstellung

LSVTD steht für Large-Scale Video Text Dataset und enthält 100 Videos aus 21 Naturszenen. Der Datensatz deckt ein breites Spektrum von 13 Innenszenen (z. B. Buchhandlungen, Einkaufszentren) und 9 Außenszenen ab und seine Vielfalt ist mehr als dreimal so groß wie die des IC15-Datensatzes.

Dieser Datensatz wurde von Community-Nutzern beigesteuert und dient ausschließlich Bildungs- und Informationszwecken. Falls Inhalte eine Urheberrechtsverletzung darstellen, kontaktieren Sie uns bitte unter [email protected] zur umgehenden Prüfung und Entfernung.

Zugehörige Datensätze

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

Auf Discord diskutieren

Datum

vor 4 Jahren

Organisation

Veröffentlichungs-URL

davar-lab.github.io

Paper-URL

arxiv.org

Lizenz

Other

Zugehörige Datensätze

DRACO Cross-Domain Deep Research Benchmark-Datensatz

vor 2 Monaten

THINGS-EEG EEG-Datensatz

vor 5 Monaten

THINGS-MEG-Magnetoenzephalographie-Datensatz

vor 5 Monaten

THINGS-fMRI-Datensatz Für Funktionelle Magnetresonanztomographie

vor 5 Monaten

RoVid-X-Roboter-Videogenerierungsdatensatz

vor 8 Tagen

TransPhy3D Transparent Reflection Synthesis Video Dataset

vor 5 Monaten

MCD-rPPG Multi-Kamera-Fernphotoplethysmographie-Datensatz

vor 6 Monaten

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

Command Palette

LSVTD-Datensatz Zum Verständnis Von Videotexten

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

LSVTD-Datensatz Zum Verständnis Von Videotexten

Zugehörige Datensätze

DRACO Cross-Domain Deep Research Benchmark-Datensatz

THINGS-EEG EEG-Datensatz

THINGS-MEG-Magnetoenzephalographie-Datensatz

THINGS-fMRI-Datensatz Für Funktionelle Magnetresonanztomographie

RoVid-X-Roboter-Videogenerierungsdatensatz

TransPhy3D Transparent Reflection Synthesis Video Dataset

MCD-rPPG Multi-Kamera-Fernphotoplethysmographie-Datensatz

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

LSVTD-Datensatz Zum Verständnis Von Videotexten

Zugehörige Datensätze

DRACO Cross-Domain Deep Research Benchmark-Datensatz

THINGS-EEG EEG-Datensatz

THINGS-MEG-Magnetoenzephalographie-Datensatz

THINGS-fMRI-Datensatz Für Funktionelle Magnetresonanztomographie

RoVid-X-Roboter-Videogenerierungsdatensatz

TransPhy3D Transparent Reflection Synthesis Video Dataset

MCD-rPPG Multi-Kamera-Fernphotoplethysmographie-Datensatz

KI mit KI entwickeln

HyperAI Newsletters

Zugehörige Datensätze

DRACO Cross-Domain Deep Research Benchmark-Datensatz

THINGS-EEG EEG-Datensatz

THINGS-MEG-Magnetoenzephalographie-Datensatz

THINGS-fMRI-Datensatz Für Funktionelle Magnetresonanztomographie

RoVid-X-Roboter-Videogenerierungsdatensatz

TransPhy3D Transparent Reflection Synthesis Video Dataset

MCD-rPPG Multi-Kamera-Fernphotoplethysmographie-Datensatz

Zugehörige Datensätze

DRACO Cross-Domain Deep Research Benchmark-Datensatz

THINGS-EEG EEG-Datensatz

THINGS-MEG-Magnetoenzephalographie-Datensatz

THINGS-fMRI-Datensatz Für Funktionelle Magnetresonanztomographie

RoVid-X-Roboter-Videogenerierungsdatensatz

TransPhy3D Transparent Reflection Synthesis Video Dataset

MCD-rPPG Multi-Kamera-Fernphotoplethysmographie-Datensatz