Command Palette
Search for a command to run...
OmniParsingBench Multimodal Parsing Capability Evaluation Dataset
Datum
Paper-URL
Lizenz
Apache 2.0
OmniParsingBench ist ein Benchmark-Datensatz, der 2026 von Alibaba zur Bewertung der einheitlichen Parsing-Fähigkeiten multimodaler großer Modelle (MLLM) veröffentlicht wurde. Zugehörige Forschungsarbeiten umfassen… Technischer Bericht zur Logik-Analyse-OmniZiel ist es, die Grenzen der traditionellen Einzelaufgabenbewertung zu überwinden, die Fähigkeiten des Modells im gesamten Prozess von der Wahrnehmung bis zur Kognition systematisch zu bewerten und wird in Szenarien wie multimodalem Verständnis, strukturierter Informationsextraktion und Forschung zu komplexen Denkfähigkeiten häufig eingesetzt. Dieser Datensatz umfasst ca. 5.294 Beispiele aus sechs Modalitäten (natürliche Bilder, Grafiken, Dokumente, Audio, natürliches Video und textintensives Video) und führt drei Bewertungsmetriken ein: Wahrnehmung (Perc.), Kognition (Cog.) und Gesamtbewertung (Ovr.). Jeder Datensatz enthält eine Bild- oder Audio-/Videoeingabe sowie eine zugehörige strukturierte Parsing-Aufgabe.
KI mit KI entwickeln
Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.