Command Palette
Search for a command to run...
VCBench-Benchmark-Datensatz Für Mathematisches Denken
VCBench ist ein Benchmark-Datensatz zur Bewertung multimodalen mathematischen Denkens mit expliziten visuellen Abhängigkeiten, der 2025 von Alibaba und der Zhejiang-Universität veröffentlicht wurde. Der Datensatz enthält 1.720 Frage-Antwort-Paare und insgesamt 6.697 Bilder.
Die Fragen umfassen im Wesentlichen folgende 6 Bereiche:
- Zeit und Kalender: Testet Fragen zum zeitlichen Denken in zwei Unterkategorien (Kalender und Uhr) und erfordert ein Verständnis von Zeitintervallen und kalenderbasierten Berechnungen.
- Raum und Position: Die Herausforderungen konzentrieren sich auf das räumliche Vorstellungsvermögen in drei Unterkategorien (Richtung, Position und Ort), um das Verständnis der relativen Position, Richtung und räumlichen Beziehungen zu beurteilen.
- Geometrie und Formen: Fragen zu fünf Unterkategorien (Winkel, Vierecke, Rechtecke, Formen und Dreiecke) testen das grundlegende geometrische Verständnis von der einfachen Formerkennung bis hin zur Analyse komplexerer Eigenschaften.
- Objekte und Bewegung: Aufgaben in zwei Unterkategorien (Würfel und Bewegung), die das Verständnis dreidimensionaler Objekte und Bewegungstransformationen bewerten.
- Argumentation und Beobachtung: Fragen in beiden Unterkategorien (Schlussfolgerung und Beobachtung) sind darauf ausgelegt, logisches Denken und sorgfältige visuelle Beobachtungsfähigkeiten zu testen.
- Organisation und Muster: Herausforderungen in drei Unterkategorien (Organisation, Muster und Gewichtung), zur Bewertung der Mustererkennung, Sequenzierung und Organisationslogik.

Build AI with AI
From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.