Command Palette
Search for a command to run...
Ensemble De Données d'inférence Visuelle VisCoR-55K
VisCoR-55K est un jeu de données de raisonnement visuel de haute qualité, publié en 2026 par l'Université des sciences et technologies de Huazhong en collaboration avec Alibaba Cloud. Ce jeu de données contient environ 55 000 exemples de raisonnement visuel, chacun générant un processus de raisonnement correspondant à partir d'exemples comparatifs. Il couvre cinq grandes catégories de jeux de données de raisonnement visuel de haute qualité : général, raisonnement, mathématique, graphes et reconnaissance optique de caractères (OCR). Son objectif est de promouvoir la recherche sur un raisonnement visuel fiable et robuste utilisant des modèles de langage visuel. Composition de l'ensemble de données – Exemples de questions-réponses visuelles : Exemples originaux de questions-réponses visuelles – Contreparties contrastives : paires de questions-réponses utilisées pour encourager un raisonnement crédible. – Justifications générées : Chaînes d’inférence de haute qualité synthétisées à l’aide du cadre VC-STaR

Citation
@inproceedings{pan2026through,
title={Through the Lens of Contrast: Self-Improving Visual Reasoning in VLMs},
author={Pan, Zhiyu and Wu, Yizheng and Hua, Jiasheng and Feng, Junyi and Yan, Shaotian and Deng, Bing and Cao, Zhiguo and Ye, Jieping},
booktitle={The Fourteenth International Conference on Learning Representations},
year={2026}
}
Créer de l'IA avec l'IA
De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.