Command Palette
Search for a command to run...
مجموعة بيانات معيارية للاستدلال المكاني البانورامي الشامل
التاريخ
الحجم
رابط الورقة البحثية
الترخيص
Apache 2.0
OmniSpatial هي مجموعة بيانات مرجعية للاستدلال المكاني البانورامي، أصدرتها جامعة تسينغهوا، ومعهد شنغهاي للذكاء، ومختبر شنغهاي للذكاء الاصطناعي، ومؤسسات أخرى عام ٢٠٢٥. نتائج البحث ذات الصلة هي:OmniSpatial: نحو معيار شامل للتفكير المكاني لنماذج اللغة البصرية، والذي يهدف إلى سد الفجوة في تقييم فهم نموذج الرؤية واللغة.
تحتوي هذه المجموعة من البيانات على ما يقارب 1533 مثالاً على أسئلة الصور والإجابة عليها، تغطي أربع فئات رئيسية من مهام التفكير المكاني: التفكير الديناميكي، والمنطق المكاني المعقد، والتفاعل المكاني، وأخذ المنظور، مع ما مجموعه 50 مهمة فرعية. تأتي البيانات من مصادر متنوعة، بما في ذلك صور الإنترنت، واختبارات علم النفس، وأسئلة اختبار القيادة. خضعت التعليقات التوضيحية لجولات مراجعة متعددة لضمان الجودة والتنوع. بالمقارنة مع معايير الأداء التقليدية، يتجنب OmniSpatial البناء القائم على القوالب، وهو أكثر واقعية وتعقيدًا. فهو لا يختبر العلاقات المكانية الأساسية فحسب (مثل: أمامي-خلفي، يسار-يمين، وقريب-بعيد)، بل يركز أيضًا على التفاعلات بين الكائنات المتعددة، وتغيرات المشهد، والتفكير من وجهات نظر مختلفة.
هذه المجموعة من البيانات مناسبة لتدريب وتقييم قدرات الاستدلال المكاني للنماذج متعددة الوسائط الكبيرة، وخاصةً في تطبيقات مثل الملاحة الذكية، والواقع المعزز/الافتراضي، وفهم المشاهد المعقدة. وهي مجموعة بيانات مرجعية موحدة شاملة وصعبة.
بناء الذكاء الاصطناعي بالذكاء الاصطناعي
من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.