Command Palette
Search for a command to run...
VisCoR-55K Visual Inference Dataset
VisCoR-55K ist ein hochwertiger Datensatz für visuelles Schließen, der 2026 von der Huazhong University of Science and Technology in Zusammenarbeit mit Alibaba Cloud veröffentlicht wurde. Der Datensatz umfasst ca. 55.000 Beispiele für visuelles Schließen, wobei jedes Beispiel anhand von Vergleichsbeispielen einen entsprechenden Schlussfolgerungsprozess generiert. Er deckt fünf Hauptkategorien hochwertiger Datensätze für visuelles Schließen ab: allgemeines Schließen, logisches Schließen, mathematisches Schließen, Graphen und OCR. Ziel ist es, die Forschung an zuverlässigem und robustem visuellem Schließen mithilfe visueller Sprachmodelle zu fördern. Datensatzzusammensetzung – VQA-Beispiele: Originale Beispiele für visuelle Fragebeantwortung – Kontrastive Gegenstücke: Passende Frage-Antwort-Paare, die verwendet werden, um glaubwürdiges Denken zu fördern. – Generierte Begründungen: Hochwertige Inferenzketten, die mithilfe des VC-STaR-Frameworks synthetisiert wurden.

Zitat
@inproceedings{pan2026through,
title={Through the Lens of Contrast: Self-Improving Visual Reasoning in VLMs},
author={Pan, Zhiyu and Wu, Yizheng and Hua, Jiasheng and Feng, Junyi and Yan, Shaotian and Deng, Bing and Cao, Zhiguo and Ye, Jieping},
booktitle={The Fourteenth International Conference on Learning Representations},
year={2026}
}
KI mit KI entwickeln
Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.