HyperAIHyperAI

Command Palette

Search for a command to run...

VCBench-Benchmark-Datensatz Für Mathematisches Denken

Date

vor 6 Monaten

Size

86.04 MB

Organization

Zhejiang-Universität

Paper URL

arxiv.org

VCBench ist ein Benchmark-Datensatz zur Bewertung multimodalen mathematischen Denkens mit expliziten visuellen Abhängigkeiten, der 2025 von Alibaba und der Zhejiang-Universität veröffentlicht wurde. Der Datensatz enthält 1.720 Frage-Antwort-Paare und insgesamt 6.697 Bilder.

Die Fragen umfassen im Wesentlichen folgende 6 Bereiche:

  • Zeit und Kalender: Testet Fragen zum zeitlichen Denken in zwei Unterkategorien (Kalender und Uhr) und erfordert ein Verständnis von Zeitintervallen und kalenderbasierten Berechnungen.
  • Raum und Position: Die Herausforderungen konzentrieren sich auf das räumliche Vorstellungsvermögen in drei Unterkategorien (Richtung, Position und Ort), um das Verständnis der relativen Position, Richtung und räumlichen Beziehungen zu beurteilen.
  • Geometrie und Formen: Fragen zu fünf Unterkategorien (Winkel, Vierecke, Rechtecke, Formen und Dreiecke) testen das grundlegende geometrische Verständnis von der einfachen Formerkennung bis hin zur Analyse komplexerer Eigenschaften.
  • Objekte und Bewegung: Aufgaben in zwei Unterkategorien (Würfel und Bewegung), die das Verständnis dreidimensionaler Objekte und Bewegungstransformationen bewerten.
  • Argumentation und Beobachtung: Fragen in beiden Unterkategorien (Schlussfolgerung und Beobachtung) sind darauf ausgelegt, logisches Denken und sorgfältige visuelle Beobachtungsfähigkeiten zu testen.
  • Organisation und Muster: Herausforderungen in drei Unterkategorien (Organisation, Muster und Gewichtung), zur Bewertung der Mustererkennung, Sequenzierung und Organisationslogik.
Datensatz-Fragetyp
VCBench.torrent
Seeding 1Downloading 0Completed 45Total Downloads 140
  • VCBench/
    • README.md
      1.89 KB
    • README.txt
      3.78 KB
      • data/
        • VCBench.zip
          86.04 MB

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp