HyperAIHyperAI

Command Palette

Search for a command to run...

مجموعة بيانات الاستدلال البصري VisCoR-55K

التاريخ

منذ شهر واحد

المؤسسة

Alibaba Group
华中科技大学

الترخيص

MIT

VisCoR-55K هي مجموعة بيانات عالية الجودة للاستدلال البصري، أُصدرت عام 2026 من قِبل جامعة هوا تشونغ للعلوم والتكنولوجيا بالتعاون مع علي بابا كلاود. تحتوي المجموعة على ما يقارب 55,000 عينة استدلال بصري، تُولّد كل منها عملية استدلال مُقابلة باستخدام عينات مُقارنة. تُغطي المجموعة خمس فئات رئيسية من مجموعات بيانات الاستدلال البصري عالية الجودة: العامة، والاستدلال، والرياضية، والرسوم البيانية، والتعرف الضوئي على الأحرف (OCR)، وتهدف إلى تعزيز البحث في مجال الاستدلال البصري الموثوق والقوي باستخدام نماذج اللغة البصرية. تكوين مجموعة البيانات – نماذج VQA: نماذج أصلية للإجابة على الأسئلة المرئية – النظراء المتقابلون: أزواج الأسئلة والأجوبة المتطابقة المستخدمة لتشجيع التفكير المنطقي.

  • المبررات المُولَّدة: سلاسل استدلال عالية الجودة مُصنَّعة باستخدام إطار عمل VC-STaR
    مثال لمجموعة البيانات
    مثال لمجموعة البيانات

الاستشهاد

@inproceedings{pan2026through,
title={Through the Lens of Contrast: Self-Improving Visual Reasoning in VLMs},
author={Pan, Zhiyu and Wu, Yizheng and Hua, Jiasheng and Feng, Junyi and Yan, Shaotian and Deng, Bing and Cao, Zhiguo and Ye, Jieping},
booktitle={The Fourteenth International Conference on Learning Representations},
year={2026}
}

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp