HyperAI

معيار الذكاء المكاني البصري VSI-Bench

التاريخ

منذ 4 أشهر

الحجم

5.34 GB

المؤسسة

جامعة ستانفورد
جامعة ييل

رابط النشر

vision-x-nyu.github.io

VSI-Bench (معيار الذكاء البصري المكاني) هو مجموعة اختبارات معيارية للذكاء البصري المكاني أطلقها Fei-Fei Li وSai-Ning Xie وفريق البحث الخاص بهما في عام 2024. ويهدف إلى تقييم قدرة نماذج اللغة الكبيرة متعددة الوسائط (MLLMs) في الإدراك والفهم المكاني. "نتائج الورقة ذات الصلة هي"التفكير في الفضاء: كيف ترى نماذج اللغة الكبيرة متعددة الوسائط الفضاءات وتتذكرها وتستدعيهاتحتوي مجموعة البيانات على أكثر من 5 آلاف زوج من الأسئلة والأجوبة، تغطي ما يقرب من 290 فيديو لمناظر داخلية حقيقية، تشمل بيئات متنوعة مثل المساكن والمكاتب والمصانع، وتغطي قضايا متعددة مثل التعرف على الأشياء، وعلاقة الموقع، والتنبؤ بالحركة. لا يقتصر هذا الهيكل المتنوع للبيانات على مساعدة المطورين في تدريب نماذج أكثر متانة فحسب، بل يوفر أيضًا موارد غنية للتحقق من الخوارزميات وتحسينها.

عرض توضيحي لمهمة VSI-Bench
VSI-Bench.torrent
البذر 1التنزيل 1مكتمل 45إجمالي التنزيلات 50
  • VSI-Bench/
    • README.md
      1.62 KB
    • README.txt
      3.23 KB
      • data/
        • VSI-Bench.zip
          5.34 GB