Mmr Total
Die Gesamtaufgabe MMR im Multi-Modal Reading (MMR) Benchmark dient dazu, die Leistungsfähigkeit des Modells bei der Bearbeitung von 11 verschiedenen Teilaufgaben zu bewerten. Diese Teilaufgaben umfassen Text, Schriftarten, visuelle Elemente, Begrenzungsrahmen, räumliche Beziehungen und grundlegende Positionierung. Die Aufgabe misst die multimodale Leseverständnisfähigkeit des Modells umfassend, indem sie die Punktzahlen aller Teilaufgaben zusammenfasst. Dies bietet eine wichtige Referenz für Forschung und Anwendungen im Bereich der Computer Vision.