HyperAIHyperAI

Command Palette

Search for a command to run...

MDPBench Multilingual Document Parsing Benchmark Dataset

Datum

vor 6 Stunden

Paper-URL

2603.28130

Lizenz

Apache 2.0

MDPBench ist ein Benchmark-Datensatz für die Analyse mehrsprachiger digitaler und fotografischer Dokumente; zugehörige Forschungsarbeiten umfassen... MDPBench: Ein Benchmark für die mehrsprachige Dokumentenanalyse in realen SzenarienZiel ist es, die Fähigkeit des Modells zur Analyse mehrsprachiger Dokumente in realen, komplexen Szenarien zu evaluieren und zu verbessern. Der Datensatz umfasst 3.400 Dokumentenbilder in 17 Sprachen, darunter Vereinfachtes Chinesisch, Traditionelles Chinesisch, Englisch, Arabisch, Deutsch, Spanisch, Französisch, Hindi, Indonesisch, Italienisch, Japanisch, Koreanisch, Portugiesisch, Russisch, Thailändisch und Vietnamesisch. Die Bilder wurden einem sorgfältigen Prozess aus Expertenmodell-Annotation, manueller Korrektur und manueller Überprüfung unterzogen, um qualitativ hochwertige Annotationen zu gewährleisten.

Dataset-Beispiel
Dataset-Beispiel

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp