HyperAI超神经

VSI-Bench (معيار الذكاء البصري المكاني) هو مجموعة اختبارات معيارية للذكاء البصري المكاني أطلقها Fei-Fei Li وSai-Ning Xie وفريق البحث الخاص بهما في عام 2024. ويهدف إلى تقييم قدرة نماذج اللغة الكبيرة متعددة الوسائط (MLLMs) في الإدراك والفهم المكاني. "نتائج الورقة ذات الصلة هي"التفكير في الفضاء: كيف ترى نماذج اللغة الكبيرة متعددة الوسائط الفضاءات وتتذكرها وتستدعيهاتحتوي مجموعة البيانات على أكثر من 5 آلاف زوج من الأسئلة والأجوبة، تغطي ما يقرب من 290 فيديو لمناظر داخلية حقيقية، تشمل بيئات متنوعة مثل المساكن والمكاتب والمصانع، وتغطي قضايا متعددة مثل التعرف على الأشياء، وعلاقة الموقع، والتنبؤ بالحركة. لا يقتصر هذا الهيكل المتنوع للبيانات على مساعدة المطورين في تدريب نماذج أكثر متانة فحسب، بل يوفر أيضًا موارد غنية للتحقق من الخوارزميات وتحسينها.

معيار الذكاء المكاني البصري VSI-Bench