HyperAIHyperAI

Command Palette

Search for a command to run...

يصف CapRL التعلم التعزيزي

Date

منذ 2 أشهر

Organization

الجامعة الصينية في هونغ كونغ
جامعة العلوم والتكنولوجيا في الصين
مختبر الذكاء الاصطناعي في شنغهاي

Paper URL

2509.22647

تم اقتراح مشروع CapRL في سبتمبر 2025 من قِبل فريق بحثي من جامعة العلوم والتكنولوجيا الصينية، وجامعة هونغ كونغ الصينية، ومختبر الذكاء الاصطناعي في شنغهاي، ومؤسسات أخرى. نُشرت نتائج البحث ذات الصلة في ورقة بحثية بعنوان "...".CapRL: تحفيز قدرات كتابة التعليقات التوضيحية للصور الكثيفة من خلال التعلم التعزيزي".

CapRL هو إطار عمل تدريبي مبتكر يُعيد تعريف جودة الوصف من خلال التطبيق العملي: فالأوصاف عالية الجودة تُمكّن نماذج اللغة غير المرئية من الإجابة بدقة على أسئلة حول الصورة المقابلة. يستخدم هذا الإطار عمليةً منفصلةً من مرحلتين، حيث يُولّد نموذج لغة بصرية كبير (LVLM) الوصف، بينما تُستمدّ المكافأة الموضوعية من دقة نموذج لغة بصرية كبير (LLM) منفصل في الإجابة على أسئلة الاختيار من متعدد بناءً على هذا الوصف. بعد تدريبه مسبقًا على مجموعة بيانات وصف CapRL-5M المُعلّق عليها باستخدام CapRL-3B، يُحقق CapRL تحسيناتٍ كبيرةً عبر 12 معيارًا. علاوةً على ذلك، ضمن إطار Prism لتقييم جودة الوصف، يُضاهي أداؤه أداء Qwen2.5-VL-72B، متفوقًا على خط الأساس بمتوسط 8.41 TP3T.

طريقة CapRL

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
يصف CapRL التعلم التعزيزي | Wiki | HyperAI