منذ 3 أشهر

الملخص

توفر التعلم المعزز (RL) إطارًا منهجيًا لتحسين نماذج الرؤية واللغة (VLMs) في المهام المعقدة المتعلقة بالاستنتاج. ومع ذلك، تعتمد الطرق الحالية للتقوية على علامات مُصنفة يدويًا أو على قواعد مخصصة للمهام لتعريف المكافآت القابلة للتحقق، وهي أمور مكلفة وصعبة التوسع. نقدم "VisPlay"، إطارًا ذاتي التطور للتقوية المعززة، الذي يمكّن نماذج الرؤية واللغة من تحسين قدراتها الاستنتاجية بشكل مستقل باستخدام كميات كبيرة من البيانات الصورية غير المُصنفة. يبدأ VisPlay من نموذج أساسي واحد، ثم يُعيّن النموذج دورين تفاعليين: "مُسْتَفْتِي مُشْرَطٌ بالصورة"، الذي يُولِّد أسئلة بصرية صعبة لكنها قابلة للإجابة، و"مُستَنْبِت متعدد الوسائط"، الذي يُولِّد إجابات ذهبية (silver responses). يتم تدريب هذين الدورين معًا باستخدام خوارزمية تحسين السياسة النسبية الجماعية (GRPO)، التي تدمج مكافآت التنوّع والصعوبة لموازنة تعقيد الأسئلة المولَّدة مع جودة الإجابات الذهبية. يُظهر VisPlay كفاءة في التوسع عبر عائلتين من النماذج. عند تدريبه على نماذج Qwen2.5-VL وMiMo-VL، يحقّق VisPlay تحسينات ثابتة في الاستدلال البصري، والتمييز التراكبي، وخفض التصوّرات الخاطئة عبر ثمانية معايير اختبار، بما في ذلك MM-Vet وMMMU، مما يُشير إلى طريق قابل للتوسع نحو الذكاء المتعدد الوسائط ذاتي التطور. يمكن الاطلاع على صفحة المشروع عبر الرابط: https://bruno686.github.io/VisPlay/

ملف PDF المصدر

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا

سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين

مدعوم بواسطة MailChimp

الملخص

Yicheng He Chengsong Huang Zongxia Li Jiaxin Huang Yonghui Yang

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Yicheng He Chengsong Huang Zongxia Li Jiaxin Huang Yonghui Yang

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Yicheng He Chengsong Huang Zongxia Li Jiaxin Huang Yonghui Yang

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

VisPlay: نماذج لغة-رؤية متعددة التطور الذاتي من الصور

Yicheng He Chengsong Huang Zongxia Li Jiaxin Huang Yonghui Yang

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

VisPlay: نماذج لغة-رؤية متعددة التطور الذاتي من الصور

Yicheng He Chengsong Huang Zongxia Li Jiaxin Huang Yonghui Yang

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

VisPlay: نماذج لغة-رؤية متعددة التطور الذاتي من الصور

Yicheng He Chengsong Huang Zongxia Li Jiaxin Huang Yonghui Yang

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters