GGBench: Ein geometrisches generatives Schlussfolgerungsbenchmark für einheitliche multimodale Modelle
Jingxuan Wei Caijun Jia Xi Bai Xinglong Xu Siyuan Li Linzhuang Sun Bihui Yu Conghui He Lijun Wu Cheng Tan

Abstract
Der Aufstieg einheitlicher multimodaler Modelle (Unified Multimodal Models, UMMs) markiert einen Paradigmenwechsel in der künstlichen Intelligenz, der von einer passiven Wahrnehmung hin zu aktiver, multimodaler Generierung führt. Trotz ihrer beispiellosen Fähigkeit, Informationen zu synthetisieren, besteht weiterhin eine kritische Lücke in der Bewertung: Bestehende Benchmarks bewerten primär diskriminative Verständnisfähigkeiten oder unbeschränkte Bildgenerierung getrennt und messen somit nicht den integrierten kognitiven Prozess des generativen Schließens. Um diese Lücke zu schließen, schlagen wir vor, die geometrische Konstruktion als ideales Testfeld zu nutzen, da sie inhärent eine Fusion aus Sprachverständnis und präziser visueller Generierung erfordert. Wir stellen GGBench vor, einen speziell dafür entwickelten Benchmark zur Bewertung geometrischer generativer Schlussfolgerung. Er bietet einen umfassenden Rahmen, um systematisch die Fähigkeit eines Modells zu diagnostizieren, nicht nur zu verstehen und zu schließen, sondern aktiv eine Lösung zu konstruieren. Damit wird ein strengeres Maßstab für die nächste Generation intelligenter Systeme gesetzt. Projekt-Website: https://opendatalab-raiser.github.io/GGBench/.
KI mit KI entwickeln
Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.