HyperAIHyperAI

Command Palette

Search for a command to run...

MMMC-Benchmark-Datensatz Zur Erstellung Von Lehrvideos

Auf Discord diskutieren

Datum

vor 4 Monaten

Organisation

Nationale Universität von Singapur

Paper-URL

2510.01174

Lizenz

MIT

MMMC ist ein umfangreicher, multidisziplinärer Benchmark-Datensatz für die Erstellung von Lehrvideos, der 2025 vom Show Lab der National University of Singapore veröffentlicht wurde. Die zugehörigen Ergebnisse der Studie lauten:Code2Video: Ein Code-zentriertes Paradigma für die Erstellung von Lehrvideos“, dessen Ziel es ist, hochwertige Schulungs- und Evaluierungsressourcen für pädagogische Modelle der künstlichen Intelligenz bereitzustellen und die Forschung zur automatischen Generierung professioneller Lehrvideos aus strukturiertem Code und Lehrinhalten zu unterstützen.

Dieser Datensatz enthält 117 vollständige Lehrvideos zu 13 Themenbereichen, darunter Analysis, Geometrie, Wahrscheinlichkeitstheorie und neuronale Netzwerke. Die durchschnittliche Länge eines vollständigen Videos beträgt 1.014 Sekunden (ca. 16,9 Minuten), während die durchschnittliche Länge eines segmentierten Videos 201 Sekunden (ca. 3,35 Minuten) beträgt. Die Daten stammen aus der YouTube-Lehrvideobibliothek 3Blue1Brown (3B1B), die für ihren wirkungsvollen Unterricht und ihre exquisite Animationsproduktion bekannt ist. MMMC wurde anhand zweier Kriterien erstellt: pädagogische Relevanz, d. h. jedes Thema besitzt einen pädagogischen Wert, und umsetzbare Unterstützung, wobei jedes Konzept einer hochwertigen Manim-Referenz entspricht, um Visualisierung und Reproduzierbarkeit zu gewährleisten.

Datensatzstruktur

  • Datendateien
    • metadata.jsonl: Die Hauptmetadatendatei mit strukturierten Informationen für jede Videoinstanz.
  • Jeder Eintrag in metadata.jsonl enthält:
    • id: Eindeutige Kennung des Video-Slices.
    • Kategorie: Fachkategorie auf höherem Niveau (z. B. Mathematik, Physik, Informatik).
    • Video: Der Dateipfad des entsprechenden Lehrvideoclips.
    • main_topics: Liste der Unterrichtsthemen.
    • num_slices: Die Anzahl der Video-Slices, in die die Vorlesung unterteilt ist.
    • reference_image: Ein wichtiges Referenzbild zum Thema (optional).

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp