Datum

vor einem Jahr

Organisation

Paper-URL

Tags

Bei diesem Datensatz handelt es sich um einen multimodalen Lehrbuchdatensatz, der 2025 von der Alibaba DAMO Academy veröffentlicht wurde. Die relevanten Ergebnisse des Papiers sind:2,5 Jahre Unterricht: Ein multimodales Lehrbuch für das visuelle Sprachtraining“, dessen Ziel darin besteht, das multimodale Vortraining zu verbessern und die Fähigkeit des Modells zu erweitern, verschachtelte visuelle und textuelle Eingaben zu verarbeiten. Der Datensatz enthält 6,5 Millionen Bilder und 800 Millionen Textdaten aus Lehrvideos. Alle Bilder und Texte stammen aus Online-Lehrvideos (22.000 Unterrichtsstunden) und decken sechs grundlegende Fächer wie Mathematik, Physik und Chemie ab. Sie bieten einen verständlicheren Hintergrund und umfassenderes Wissen für die Bild-Text-Zuordnung. Beispiel für das Erstellen eines Datensatzes aus einem Tutorial-Video

Dieser Datensatz wurde von Community-Nutzern beigesteuert und dient ausschließlich Bildungs- und Informationszwecken. Falls Inhalte eine Urheberrechtsverletzung darstellen, kontaktieren Sie uns bitte unter [email protected] zur umgehenden Prüfung und Entfernung.

Zugehörige Datensätze

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

Auf Discord diskutieren

Datum

vor einem Jahr

Organisation

Paper-URL

arxiv.org

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

Command Palette

Multimodal-Textbook-6.5M Multimodaler Lehrbuchdatensatz

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

Multimodal-Textbook-6.5M Multimodaler Lehrbuchdatensatz

Zugehörige Datensätze

DRACO Cross-Domain Deep Research Benchmark-Datensatz

Nemotron Personas Frankreich (Französischer Datensatz Synthetischer Personas)

Sutra 10B Vortrainings- Und Trainingsdatensatz

Datensatz Zur Psychischen Gesundheit Und Zum Burnout Von Studierenden

Groundsource Global Flood Events Dataset

CHIMERA Allgemeines Inferenz-Synthetik-Datensatz

Pan-Cancer scRNA-Seq Cancer Single-Cell Transcriptional Atlas Dataset

THINGS-EEG EEG-Datensatz

THINGS-MEG-Magnetoenzephalographie-Datensatz

THINGS-fMRI-Datensatz Für Funktionelle Magnetresonanztomographie

Nemotron-Personas-Brazil Brasilianischer Datensatz Für Synthetische Charaktere

CL-bench Context Learning Evaluation Benchmark-Datensatz

RoVid-X-Roboter-Videogenerierungsdatensatz

LightOnOCR-mix-0126 Texttranskriptionsdatensatz

TransPhy3D Transparent Reflection Synthesis Video Dataset

GroundingME-Datensatz Zur Evaluierung Des Verständnisses Komplexer Szenen

MCIF Multimodal Cross-Language Instruction Following Dataset

TxT360-3efforts Multi-Task Inference Dataset

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

Multimodal-Textbook-6.5M Multimodaler Lehrbuchdatensatz

Zugehörige Datensätze

DRACO Cross-Domain Deep Research Benchmark-Datensatz

Nemotron Personas Frankreich (Französischer Datensatz Synthetischer Personas)

Sutra 10B Vortrainings- Und Trainingsdatensatz

Datensatz Zur Psychischen Gesundheit Und Zum Burnout Von Studierenden

Groundsource Global Flood Events Dataset

CHIMERA Allgemeines Inferenz-Synthetik-Datensatz

Pan-Cancer scRNA-Seq Cancer Single-Cell Transcriptional Atlas Dataset

THINGS-EEG EEG-Datensatz

THINGS-MEG-Magnetoenzephalographie-Datensatz

THINGS-fMRI-Datensatz Für Funktionelle Magnetresonanztomographie

Nemotron-Personas-Brazil Brasilianischer Datensatz Für Synthetische Charaktere

CL-bench Context Learning Evaluation Benchmark-Datensatz

RoVid-X-Roboter-Videogenerierungsdatensatz

LightOnOCR-mix-0126 Texttranskriptionsdatensatz

TransPhy3D Transparent Reflection Synthesis Video Dataset

GroundingME-Datensatz Zur Evaluierung Des Verständnisses Komplexer Szenen

MCIF Multimodal Cross-Language Instruction Following Dataset

TxT360-3efforts Multi-Task Inference Dataset

KI mit KI entwickeln

HyperAI Newsletters

Zugehörige Datensätze

DRACO Cross-Domain Deep Research Benchmark-Datensatz

Nemotron Personas Frankreich (Französischer Datensatz Synthetischer Personas)

Sutra 10B Vortrainings- Und Trainingsdatensatz

Datensatz Zur Psychischen Gesundheit Und Zum Burnout Von Studierenden

Groundsource Global Flood Events Dataset

CHIMERA Allgemeines Inferenz-Synthetik-Datensatz

Pan-Cancer scRNA-Seq Cancer Single-Cell Transcriptional Atlas Dataset

THINGS-EEG EEG-Datensatz

THINGS-MEG-Magnetoenzephalographie-Datensatz

THINGS-fMRI-Datensatz Für Funktionelle Magnetresonanztomographie

Nemotron-Personas-Brazil Brasilianischer Datensatz Für Synthetische Charaktere

CL-bench Context Learning Evaluation Benchmark-Datensatz

RoVid-X-Roboter-Videogenerierungsdatensatz

LightOnOCR-mix-0126 Texttranskriptionsdatensatz

TransPhy3D Transparent Reflection Synthesis Video Dataset

GroundingME-Datensatz Zur Evaluierung Des Verständnisses Komplexer Szenen

MCIF Multimodal Cross-Language Instruction Following Dataset

TxT360-3efforts Multi-Task Inference Dataset

Zugehörige Datensätze

DRACO Cross-Domain Deep Research Benchmark-Datensatz

Nemotron Personas Frankreich (Französischer Datensatz Synthetischer Personas)

Sutra 10B Vortrainings- Und Trainingsdatensatz

Datensatz Zur Psychischen Gesundheit Und Zum Burnout Von Studierenden

Groundsource Global Flood Events Dataset

CHIMERA Allgemeines Inferenz-Synthetik-Datensatz

Pan-Cancer scRNA-Seq Cancer Single-Cell Transcriptional Atlas Dataset

THINGS-EEG EEG-Datensatz

THINGS-MEG-Magnetoenzephalographie-Datensatz

THINGS-fMRI-Datensatz Für Funktionelle Magnetresonanztomographie