Command Palette
Search for a command to run...
OmniSpatial Panoramic Spatial Reasoning Benchmark-Datensatz
Datum
Größe
Paper-URL
Lizenz
Apache 2.0
OmniSpatial ist ein Benchmark-Datensatz für räumliches Panorama-Argumentieren, der 2025 von der Tsinghua-Universität, dem Shanghai Institute of Intelligence, dem Shanghai Artificial Intelligence Laboratory und anderen Institutionen veröffentlicht wurde. Die zugehörigen Ergebnisse sind:OmniSpatial: Auf dem Weg zu einem umfassenden räumlichen Schlussfolgerungs-Benchmark für Vision Language-Modelle》, das darauf abzielt, die Lücke bei der Bewertung des Verständnisses des Vision-Language-Modellraums zu schließen.
Dieser Datensatz enthält etwa 1.533 Beispiele für Bildfragen und -antworten und deckt vier Hauptkategorien räumlicher Denkaufgaben ab: dynamisches Denken, komplexe räumliche Logik, räumliche Interaktion und Perspektivübernahme, mit insgesamt 50 Unteraufgaben. Die Daten stammen aus unterschiedlichen Quellen, darunter Bilder aus dem Internet, psychologische Tests und Fragen aus Fahrprüfungen. Die Anmerkungen wurden mehreren Überprüfungsrunden unterzogen, um Qualität und Vielfalt sicherzustellen. Im Vergleich zu herkömmlichen Benchmarks vermeidet OmniSpatial eine vorlagenbasierte Konstruktion und ist realistischer und komplexer. Es testet nicht nur grundlegende räumliche Beziehungen (wie vorne-hinten, links-rechts und nah-fern), sondern legt auch Wert auf Interaktionen mehrerer Objekte, Szenenwechsel und perspektivenübergreifendes Denken.
Dieser Datensatz eignet sich zum Trainieren und Evaluieren der räumlichen Denkfähigkeiten großer multimodaler Modelle, insbesondere in Anwendungen wie intelligenter Navigation, erweiterter/virtueller Realität und dem Verständnis komplexer Szenen. Es handelt sich um einen umfassenden und anspruchsvollen standardisierten Benchmark-Datensatz.
KI mit KI entwickeln
Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.