HyperAIHyperAI

Command Palette

Search for a command to run...

يصف CapRL التعلم التعزيزي

التاريخ

منذ 2 أشهر

المؤسسة

الجامعة الصينية في هونغ كونغ
جامعة العلوم والتكنولوجيا في الصين
مختبر الذكاء الاصطناعي في شنغهاي

رابط الورقة البحثية

2509.22647

تم اقتراح مشروع CapRL في سبتمبر 2025 من قِبل فريق بحثي من جامعة العلوم والتكنولوجيا الصينية، وجامعة هونغ كونغ الصينية، ومختبر الذكاء الاصطناعي في شنغهاي، ومؤسسات أخرى. نُشرت نتائج البحث ذات الصلة في ورقة بحثية بعنوان "...".CapRL: تحفيز قدرات كتابة التعليقات التوضيحية للصور الكثيفة من خلال التعلم التعزيزي".

CapRL هو إطار عمل تدريبي مبتكر يُعيد تعريف جودة الوصف من خلال التطبيق العملي: فالأوصاف عالية الجودة تُمكّن نماذج اللغة غير المرئية من الإجابة بدقة على أسئلة حول الصورة المقابلة. يستخدم هذا الإطار عمليةً منفصلةً من مرحلتين، حيث يُولّد نموذج لغة بصرية كبير (LVLM) الوصف، بينما تُستمدّ المكافأة الموضوعية من دقة نموذج لغة بصرية كبير (LLM) منفصل في الإجابة على أسئلة الاختيار من متعدد بناءً على هذا الوصف. بعد تدريبه مسبقًا على مجموعة بيانات وصف CapRL-5M المُعلّق عليها باستخدام CapRL-3B، يُحقق CapRL تحسيناتٍ كبيرةً عبر 12 معيارًا. علاوةً على ذلك، ضمن إطار Prism لتقييم جودة الوصف، يُضاهي أداؤه أداء Qwen2.5-VL-72B، متفوقًا على خط الأساس بمتوسط 8.41 TP3T.

طريقة CapRL

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp