HyperAIHyperAI

Command Palette

Search for a command to run...

VCBench-Benchmark-Datensatz Für Mathematisches Denken

Datum

vor 8 Monaten

Größe

86.04 MB

Organisation

Alibaba-Gruppe
Zhejiang-Universität

Paper-URL

arxiv.org

VCBench ist ein Benchmark-Datensatz zur Bewertung multimodalen mathematischen Denkens mit expliziten visuellen Abhängigkeiten, der 2025 von Alibaba und der Zhejiang-Universität veröffentlicht wurde. Der Datensatz enthält 1.720 Frage-Antwort-Paare und insgesamt 6.697 Bilder.

Die Fragen umfassen im Wesentlichen folgende 6 Bereiche:

  • Zeit und Kalender: Testet Fragen zum zeitlichen Denken in zwei Unterkategorien (Kalender und Uhr) und erfordert ein Verständnis von Zeitintervallen und kalenderbasierten Berechnungen.
  • Raum und Position: Die Herausforderungen konzentrieren sich auf das räumliche Vorstellungsvermögen in drei Unterkategorien (Richtung, Position und Ort), um das Verständnis der relativen Position, Richtung und räumlichen Beziehungen zu beurteilen.
  • Geometrie und Formen: Fragen zu fünf Unterkategorien (Winkel, Vierecke, Rechtecke, Formen und Dreiecke) testen das grundlegende geometrische Verständnis von der einfachen Formerkennung bis hin zur Analyse komplexerer Eigenschaften.
  • Objekte und Bewegung: Aufgaben in zwei Unterkategorien (Würfel und Bewegung), die das Verständnis dreidimensionaler Objekte und Bewegungstransformationen bewerten.
  • Argumentation und Beobachtung: Fragen in beiden Unterkategorien (Schlussfolgerung und Beobachtung) sind darauf ausgelegt, logisches Denken und sorgfältige visuelle Beobachtungsfähigkeiten zu testen.
  • Organisation und Muster: Herausforderungen in drei Unterkategorien (Organisation, Muster und Gewichtung), zur Bewertung der Mustererkennung, Sequenzierung und Organisationslogik.
Datensatz-Fragetyp
VCBench.torrent
Seeding 1Wird heruntergeladen 0Abgeschlossen 57Gesamtdownloads 154
  • VCBench/
    • README.md
      1.89 KB
    • README.txt
      3.78 KB
      • data/
        • VCBench.zip
          86.04 MB

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp