HyperAI

M³IT: Multimodaler, Mehrsprachiger Befehlsoptimierungsdatensatz

Datum

vor einem Jahr

Organisation

Die Universität von Hongkong

Veröffentlichungs-URL

m3-it.github.io

Download-Hilfe

Der Datensatz besteht aus 40 Datensätzen.Dazu gehören 2,4 Millionen Instanzen und 400 manuell verfasste Aufgabenanweisungen.und in eine Bild-zu-Text-Struktur neu formatiert. Der Datensatz stellt eine Vielzahl von Aufgaben aus klassischen Vision-Language-Aufgaben zusammen, darunter Untertitelung, visuelle Frage- und Antwortfunktion (VQA), visuelle bedingte Generierung, Argumentation und Klassifizierung.