HyperAIHyperAI

Command Palette

Search for a command to run...

منذ 2 أشهر

استنتاج فيزيائي قابل للتفسير وتصنيف أداء في نماذج الرؤية واللغة

Pranav Pawar Kavish Shah Akshat Bhalani Komal Kasat Dev Mittal Hadi Gala Deepali Patil Nikita Raichada Monali Deshmukh

استنتاج فيزيائي قابل للتفسير وتصنيف أداء في نماذج الرؤية واللغة

الملخص

مع تطور نماذج الرؤية واللغة (VLMs) بشكل متزايد، أصبحت قدرتها على التفكير المنطقي موضوع مراقبة متزايدة. وعلى الرغم من تميزها في العديد من المهام، فإن فهمها للمبادئ العلمية الأساسية، مثل مبادئ الفيزياء، ما زال يُعدّ مجالاً غير مستكشف بالكامل. ولتعكس التطورات في هذه القدرات، نقدم إطاراً جديداً وسهل الوصول مصمماً لتقييم دقيق لفهم نماذج الرؤية واللغة للفيزياء ثنائية الأبعاد. يتميز هذا الإطار بمحرّك سيناريوهات عملي يُنشئ بيئة اختبار متنوعة تضم أكثر من 400 مشكلة متعددة في أربع مجالات أساسية: الحركة القذفية، ديناميكا التصادم، الميكانيكا، وديناميكا السوائل. ومن خلال تقييم شامل لأربع نماذج متقدمة من نوع VLMs، نُظهر ارتباطاً قوياً بين حجم النموذج وقدرته على التفكير، حيث حقق النموذج الأفضل لدينا، Qwen2.5-VL-7B، متوسط درجة تقييم بلغ 0.815. ووجدنا أن النماذج تؤدي بشكل ممتاز في المسائل الصيغية، لكنها تواجه صعوبات كبيرة في المجالات التي تتطلب تفكيراً مكانيّاً مجرّداً. وبتصميم هذا الإطار، نهدف إلى تعميم دراسة التفكير العلمي في نماذج الرؤية واللغة، وتعزيز فهم أعمق لقدراتها وحدودها.

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة المشتركة بالذكاء الاصطناعي
وحدات معالجة رسومات جاهزة
أفضل الأسعار
ابدأ الآن

Hyper Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
استنتاج فيزيائي قابل للتفسير وتصنيف أداء في نماذج الرؤية واللغة | الأوراق البحثية | HyperAI