HyperAIHyperAI

Command Palette

Search for a command to run...

vor 9 Tagen

GGBench: Ein geometrisches generatives Schlussfolgerungsbenchmark für einheitliche multimodale Modelle

Jingxuan Wei Caijun Jia Xi Bai Xinglong Xu Siyuan Li Linzhuang Sun Bihui Yu Conghui He Lijun Wu Cheng Tan

GGBench: Ein geometrisches generatives Schlussfolgerungsbenchmark für einheitliche multimodale Modelle

Abstract

Der Aufstieg einheitlicher multimodaler Modelle (Unified Multimodal Models, UMMs) markiert einen Paradigmenwechsel in der künstlichen Intelligenz, der von einer passiven Wahrnehmung hin zu aktiver, multimodaler Generierung führt. Trotz ihrer beispiellosen Fähigkeit, Informationen zu synthetisieren, besteht weiterhin eine kritische Lücke in der Bewertung: Bestehende Benchmarks bewerten primär diskriminative Verständnisfähigkeiten oder unbeschränkte Bildgenerierung getrennt und messen somit nicht den integrierten kognitiven Prozess des generativen Schließens. Um diese Lücke zu schließen, schlagen wir vor, die geometrische Konstruktion als ideales Testfeld zu nutzen, da sie inhärent eine Fusion aus Sprachverständnis und präziser visueller Generierung erfordert. Wir stellen GGBench vor, einen speziell dafür entwickelten Benchmark zur Bewertung geometrischer generativer Schlussfolgerung. Er bietet einen umfassenden Rahmen, um systematisch die Fähigkeit eines Modells zu diagnostizieren, nicht nur zu verstehen und zu schließen, sondern aktiv eine Lösung zu konstruieren. Damit wird ein strengeres Maßstab für die nächste Generation intelligenter Systeme gesetzt. Projekt-Website: https://opendatalab-raiser.github.io/GGBench/.

KI mit KI entwickeln

Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.

KI-Co-Coding
Sofort einsatzbereit GPUs
Beste Preise
Jetzt starten

Hyper Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
GGBench: Ein geometrisches generatives Schlussfolgerungsbenchmark für einheitliche multimodale Modelle | Forschungsarbeiten | HyperAI