HyperAIHyperAI

Command Palette

Search for a command to run...

Zebra-CoT-Datensatz Zur Text-Bild-Inferenz

Datum

vor 3 Monaten

Größe

63.04 GB

Organisation

Columbia Universität
Universität von Südkalifornien

Paper-URL

arxiv.org

Zebra-CoT ist ein Datensatz zum visuellen Sprachschlussfolgern, der 2025 gemeinsam von der Columbia University, der University of Maryland, der University of Southern California und der New York University veröffentlicht wird. Die zugehörigen Ergebnisse der Studie sind:Zebra-CoT: Ein Datensatz für Interleaved Vision Language Reasoning“, das darauf abzielt, das Modell zu fördern, um die logische Beziehung zwischen Bildern und Texten besser zu verstehen, und das häufig bei der Beantwortung visueller Fragen, der Generierung von Bildbeschreibungen und in anderen Bereichen verwendet wird, um die Denkfähigkeit und Genauigkeit zu verbessern.

Der Datensatz enthält 182.384 Beispiele aus vier Hauptkategorien: wissenschaftliches Denken, zweidimensionales visuelles Denken, dreidimensionales visuelles Denken sowie visuelle Logik- und Strategiespiele. Diese Beispiele enthalten logisch zusammenhängende, verschachtelte Text-Bild-Denkspuren.

Datensatzstruktur:

  • Problembeschreibung: Eine Textbeschreibung des Problems.
  • Fragebild: Je nach Art der Frage kann dieses von keinem oder mehreren Bildern begleitet sein.
  • Bilder zum Denken: Es gibt mindestens ein oder mehrere visuelle Hilfsmittel, die die Zwischenschritte des Denkens im Problemlösungsprozess unterstützen.
  • Textual Reasoning Track: Eine Reihe von Textreflexionen und entsprechenden visuellen Skizzen oder Diagrammplatzhaltern.
  • Endgültige Antwort: Lösung des Problems.

Feldverteilungskarte des Datensatzes

Zebra-CoT.torrent
Seeding 1Herunterladen 0Abgeschlossen 36Gesamtdownloads 104
  • Zebra-CoT/
    • README.md
      1.9 KB
    • README.txt
      3.8 KB
      • data/
        • Zebra-CoT.zip
          63.04 GB

KI mit KI entwickeln

Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.

KI-Co-Coding
Sofort einsatzbereit GPUs
Beste Preise
Jetzt starten

Hyper Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp