HyperAIHyperAI

Command Palette

Search for a command to run...

VCBench-Benchmark-Datensatz Für Mathematisches Denken

Datum

vor 5 Monaten

Größe

86.04 MB

Organisation

Zhejiang-Universität

Paper-URL

arxiv.org

VCBench ist ein Benchmark-Datensatz zur Bewertung multimodalen mathematischen Denkens mit expliziten visuellen Abhängigkeiten, der 2025 von Alibaba und der Zhejiang-Universität veröffentlicht wurde. Der Datensatz enthält 1.720 Frage-Antwort-Paare und insgesamt 6.697 Bilder.

Die Fragen umfassen im Wesentlichen folgende 6 Bereiche:

  • Zeit und Kalender: Testet Fragen zum zeitlichen Denken in zwei Unterkategorien (Kalender und Uhr) und erfordert ein Verständnis von Zeitintervallen und kalenderbasierten Berechnungen.
  • Raum und Position: Die Herausforderungen konzentrieren sich auf das räumliche Vorstellungsvermögen in drei Unterkategorien (Richtung, Position und Ort), um das Verständnis der relativen Position, Richtung und räumlichen Beziehungen zu beurteilen.
  • Geometrie und Formen: Fragen zu fünf Unterkategorien (Winkel, Vierecke, Rechtecke, Formen und Dreiecke) testen das grundlegende geometrische Verständnis von der einfachen Formerkennung bis hin zur Analyse komplexerer Eigenschaften.
  • Objekte und Bewegung: Aufgaben in zwei Unterkategorien (Würfel und Bewegung), die das Verständnis dreidimensionaler Objekte und Bewegungstransformationen bewerten.
  • Argumentation und Beobachtung: Fragen in beiden Unterkategorien (Schlussfolgerung und Beobachtung) sind darauf ausgelegt, logisches Denken und sorgfältige visuelle Beobachtungsfähigkeiten zu testen.
  • Organisation und Muster: Herausforderungen in drei Unterkategorien (Organisation, Muster und Gewichtung), zur Bewertung der Mustererkennung, Sequenzierung und Organisationslogik.
Datensatz-Fragetyp
VCBench.torrent
Seeding 1Herunterladen 0Abgeschlossen 43Gesamtdownloads 114
  • VCBench/
    • README.md
      1.89 KB
    • README.txt
      3.78 KB
      • data/
        • VCBench.zip
          86.04 MB

KI mit KI entwickeln

Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.

KI-Co-Coding
Sofort einsatzbereit GPUs
Beste Preise
Jetzt starten

Hyper Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
VCBench-Benchmark-Datensatz Für Mathematisches Denken | Datensätze | HyperAI