Datum

vor 10 Monaten

Größe

9.45 GB

Organisation

Paper-URL

2506.03135

Lizenz

Apache 2.0

Tags

Multimodal

Reasoning

OmniSpatial ist ein Benchmark-Datensatz für räumliches Panorama-Argumentieren, der 2025 von der Tsinghua-Universität, dem Shanghai Institute of Intelligence, dem Shanghai Artificial Intelligence Laboratory und anderen Institutionen veröffentlicht wurde. Die zugehörigen Ergebnisse sind:OmniSpatial: Auf dem Weg zu einem umfassenden räumlichen Schlussfolgerungs-Benchmark für Vision Language-Modelle》, das darauf abzielt, die Lücke bei der Bewertung des Verständnisses des Vision-Language-Modellraums zu schließen. Dieser Datensatz enthält etwa 1.533 Beispiele für Bildfragen und -antworten und deckt vier Hauptkategorien räumlicher Denkaufgaben ab: dynamisches Denken, komplexe räumliche Logik, räumliche Interaktion und Perspektivübernahme, mit insgesamt 50 Unteraufgaben. Die Daten stammen aus unterschiedlichen Quellen, darunter Bilder aus dem Internet, psychologische Tests und Fragen aus Fahrprüfungen. Die Anmerkungen wurden mehreren Überprüfungsrunden unterzogen, um Qualität und Vielfalt sicherzustellen. Im Vergleich zu herkömmlichen Benchmarks vermeidet OmniSpatial eine vorlagenbasierte Konstruktion und ist realistischer und komplexer. Es testet nicht nur grundlegende räumliche Beziehungen (wie vorne-hinten, links-rechts und nah-fern), sondern legt auch Wert auf Interaktionen mehrerer Objekte, Szenenwechsel und perspektivenübergreifendes Denken. Dieser Datensatz eignet sich zum Trainieren und Evaluieren der räumlichen Denkfähigkeiten großer multimodaler Modelle, insbesondere in Anwendungen wie intelligenter Navigation, erweiterter/virtueller Realität und dem Verständnis komplexer Szenen. Es handelt sich um einen umfassenden und anspruchsvollen standardisierten Benchmark-Datensatz.

OmniSpatial.torrent

Seeding 2Wird heruntergeladen 0Abgeschlossen 17Gesamtdownloads 113

OmniSpatial/
- README.md
  2.06 KB
- README.txt
  4.12 KB

Dieser Datensatz wurde von Community-Nutzern beigesteuert und dient ausschließlich Bildungs- und Informationszwecken. Falls Inhalte eine Urheberrechtsverletzung darstellen, kontaktieren Sie uns bitte unter [email protected] zur umgehenden Prüfung und Entfernung.

Zugehörige Datensätze

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

Diesen Datensatz verwenden

Auf Discord diskutieren

Datum

vor 10 Monaten

Größe

9.45 GB

Organisation

Paper-URL

2506.03135

Lizenz

Apache 2.0

Zugehörige Datensätze

DRACO Cross-Domain Deep Research Benchmark-Datensatz

vor 2 Monaten

CHIMERA Allgemeines Inferenz-Synthetik-Datensatz

vor 8 Tagen

RubricHub_v1 Multi-Domain Generative Task Dataset

vor 5 Monaten

CL-bench Context Learning Evaluation Benchmark-Datensatz

vor 4 Monaten

RoVid-X-Roboter-Videogenerierungsdatensatz

vor 8 Tagen

LightOnOCR-mix-0126 Texttranskriptionsdatensatz

vor 5 Monaten

Nemotron-Math-v2 Datensatz Für Mathematische Inferenz

vor 8 Tagen

GroundingME-Datensatz Zur Evaluierung Des Verständnisses Komplexer Szenen

vor 8 Tagen

MCIF Multimodal Cross-Language Instruction Following Dataset

vor 6 Monaten

TxT360-3efforts Multi-Task Inference Dataset

vor 8 Tagen

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

Command Palette

OmniSpatial Panoramic Spatial Reasoning Benchmark-Datensatz

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

OmniSpatial Panoramic Spatial Reasoning Benchmark-Datensatz

Zugehörige Datensätze

DRACO Cross-Domain Deep Research Benchmark-Datensatz

CHIMERA Allgemeines Inferenz-Synthetik-Datensatz

RubricHub_v1 Multi-Domain Generative Task Dataset

CL-bench Context Learning Evaluation Benchmark-Datensatz

RoVid-X-Roboter-Videogenerierungsdatensatz

LightOnOCR-mix-0126 Texttranskriptionsdatensatz

Nemotron-Math-v2 Datensatz Für Mathematische Inferenz

GroundingME-Datensatz Zur Evaluierung Des Verständnisses Komplexer Szenen

MCIF Multimodal Cross-Language Instruction Following Dataset

TxT360-3efforts Multi-Task Inference Dataset

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

OmniSpatial Panoramic Spatial Reasoning Benchmark-Datensatz

Zugehörige Datensätze

DRACO Cross-Domain Deep Research Benchmark-Datensatz

CHIMERA Allgemeines Inferenz-Synthetik-Datensatz

RubricHub_v1 Multi-Domain Generative Task Dataset

CL-bench Context Learning Evaluation Benchmark-Datensatz

RoVid-X-Roboter-Videogenerierungsdatensatz

LightOnOCR-mix-0126 Texttranskriptionsdatensatz

Nemotron-Math-v2 Datensatz Für Mathematische Inferenz

GroundingME-Datensatz Zur Evaluierung Des Verständnisses Komplexer Szenen

MCIF Multimodal Cross-Language Instruction Following Dataset

TxT360-3efforts Multi-Task Inference Dataset

KI mit KI entwickeln

HyperAI Newsletters

Zugehörige Datensätze

DRACO Cross-Domain Deep Research Benchmark-Datensatz

CHIMERA Allgemeines Inferenz-Synthetik-Datensatz

RubricHub_v1 Multi-Domain Generative Task Dataset

CL-bench Context Learning Evaluation Benchmark-Datensatz

RoVid-X-Roboter-Videogenerierungsdatensatz

LightOnOCR-mix-0126 Texttranskriptionsdatensatz

Nemotron-Math-v2 Datensatz Für Mathematische Inferenz

GroundingME-Datensatz Zur Evaluierung Des Verständnisses Komplexer Szenen

MCIF Multimodal Cross-Language Instruction Following Dataset

TxT360-3efforts Multi-Task Inference Dataset

Zugehörige Datensätze

DRACO Cross-Domain Deep Research Benchmark-Datensatz

CHIMERA Allgemeines Inferenz-Synthetik-Datensatz

RubricHub_v1 Multi-Domain Generative Task Dataset

CL-bench Context Learning Evaluation Benchmark-Datensatz

RoVid-X-Roboter-Videogenerierungsdatensatz

LightOnOCR-mix-0126 Texttranskriptionsdatensatz

Nemotron-Math-v2 Datensatz Für Mathematische Inferenz

GroundingME-Datensatz Zur Evaluierung Des Verständnisses Komplexer Szenen

MCIF Multimodal Cross-Language Instruction Following Dataset

TxT360-3efforts Multi-Task Inference Dataset