HyperAIHyperAI

Command Palette

Search for a command to run...

استنتاج فيزيائي قابل للتفسير وتصنيف أداء في نماذج الرؤية واللغة

Pranav Pawar Kavish Shah Akshat Bhalani Komal Kasat Dev Mittal Hadi Gala Deepali Patil Nikita Raichada Monali Deshmukh

الملخص

مع تطور نماذج الرؤية واللغة (VLMs) بشكل متزايد، أصبحت قدرتها على التفكير المنطقي موضوع مراقبة متزايدة. وعلى الرغم من تميزها في العديد من المهام، فإن فهمها للمبادئ العلمية الأساسية، مثل مبادئ الفيزياء، ما زال يُعدّ مجالاً غير مستكشف بالكامل. ولتعكس التطورات في هذه القدرات، نقدم إطاراً جديداً وسهل الوصول مصمماً لتقييم دقيق لفهم نماذج الرؤية واللغة للفيزياء ثنائية الأبعاد. يتميز هذا الإطار بمحرّك سيناريوهات عملي يُنشئ بيئة اختبار متنوعة تضم أكثر من 400 مشكلة متعددة في أربع مجالات أساسية: الحركة القذفية، ديناميكا التصادم، الميكانيكا، وديناميكا السوائل. ومن خلال تقييم شامل لأربع نماذج متقدمة من نوع VLMs، نُظهر ارتباطاً قوياً بين حجم النموذج وقدرته على التفكير، حيث حقق النموذج الأفضل لدينا، Qwen2.5-VL-7B، متوسط درجة تقييم بلغ 0.815. ووجدنا أن النماذج تؤدي بشكل ممتاز في المسائل الصيغية، لكنها تواجه صعوبات كبيرة في المجالات التي تتطلب تفكيراً مكانيّاً مجرّداً. وبتصميم هذا الإطار، نهدف إلى تعميم دراسة التفكير العلمي في نماذج الرؤية واللغة، وتعزيز فهم أعمق لقدراتها وحدودها.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp