HyperAIHyperAI

Command Palette

Search for a command to run...

VisCoR-55K Visual Inference Dataset

Datum

vor einem Monat

Organisation

Alibaba Group
华中科技大学

Lizenz

MIT

VisCoR-55K ist ein hochwertiger Datensatz für visuelles Schließen, der 2026 von der Huazhong University of Science and Technology in Zusammenarbeit mit Alibaba Cloud veröffentlicht wurde. Der Datensatz umfasst ca. 55.000 Beispiele für visuelles Schließen, wobei jedes Beispiel anhand von Vergleichsbeispielen einen entsprechenden Schlussfolgerungsprozess generiert. Er deckt fünf Hauptkategorien hochwertiger Datensätze für visuelles Schließen ab: allgemeines Schließen, logisches Schließen, mathematisches Schließen, Graphen und OCR. Ziel ist es, die Forschung an zuverlässigem und robustem visuellem Schließen mithilfe visueller Sprachmodelle zu fördern. Datensatzzusammensetzung – VQA-Beispiele: Originale Beispiele für visuelle Fragebeantwortung – Kontrastive Gegenstücke: Passende Frage-Antwort-Paare, die verwendet werden, um glaubwürdiges Denken zu fördern. – Generierte Begründungen: Hochwertige Inferenzketten, die mithilfe des VC-STaR-Frameworks synthetisiert wurden.

Dataset-Beispiel
Dataset-Beispiel

Zitat

@inproceedings{pan2026through,
title={Through the Lens of Contrast: Self-Improving Visual Reasoning in VLMs},
author={Pan, Zhiyu and Wu, Yizheng and Hua, Jiasheng and Feng, Junyi and Yan, Shaotian and Deng, Bing and Cao, Zhiguo and Ye, Jieping},
booktitle={The Fourteenth International Conference on Learning Representations},
year={2026}
}

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp