HyperAIHyperAI

Command Palette

Search for a command to run...

VL-Cogito: التعلم المعزز التدريجي بالمناهج لاستنتاج متعدد الوسائط المتقدمة

الملخص

أثبتت التعلم المعزز فعاليته في تعزيز قدرات الاستدلال النموذجات اللغوية الكبيرة. وقد تمددت الجهود البحثية الحديثة تدريجيًا على هذا النموذج لتشمل مهام الاستدلال متعدد الوسائط. وبسبب التعقيد والتنوع المتأصّل في المهام متعددة الوسائط، خاصة فيما يتعلق بالمحتوى الدلالي وصيغة المشكلات، تُظهر النماذج الحالية أداءً غير مستقر عبر مجالات متنوعة ومستويات صعوبة مختلفة. وللتغلب على هذه القيود، نقترح نموذج VL-Cogito، وهو نموذج متعدد الوسائط متقدّم تم تدريبه باستخدام إطار جديد يُسمى التعلم المعزز التدريجي بالمناهج المتعددة (PCuRL). ويُوجّه إطار PCuRL النموذج بشكل منهجي عبر مهام تزداد صعوبتها تدريجيًا، مما يُحسّن بشكل كبير قدرته على الاستدلال في سياقات متعددة الوسائط المتنوعة. ويُقدّم هذا الإطار Innovations رئيسية: (1) آلية ترجيح ديناميكية للصعوبة عبر الإنترنت، التي تُعدّل بشكل ديناميكي صعوبة التدريب في المراحل التالية من التعلم المعزز؛ و(2) آلية مكافأة مرنة الطول، التي تشجع النموذج على تعديل مسار الاستدلال تلقائيًا وفقًا لتعقيد المهمة، وبالتالي تحقيق توازن بين كفاءة الاستدلال ودقة النتائج. وتبين النتائج التجريبية أن VL-Cogito يتفوّق باستمرار أو يوازي النماذج الحالية الموجهة للاستدلال عبر معايير متعددة الوسائط الشائعة التي تغطي مجالات الرياضيات والعلوم والمنطق والفهم العام، مما يُثبت فعالية النهج المُقترح.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
VL-Cogito: التعلم المعزز التدريجي بالمناهج لاستنتاج متعدد الوسائط المتقدمة | مستندات | HyperAI