Command Palette
Search for a command to run...
يصف CapRL التعلم التعزيزي
تم اقتراح مشروع CapRL في سبتمبر 2025 من قِبل فريق بحثي من جامعة العلوم والتكنولوجيا الصينية، وجامعة هونغ كونغ الصينية، ومختبر الذكاء الاصطناعي في شنغهاي، ومؤسسات أخرى. نُشرت نتائج البحث ذات الصلة في ورقة بحثية بعنوان "...".CapRL: تحفيز قدرات كتابة التعليقات التوضيحية للصور الكثيفة من خلال التعلم التعزيزي".
CapRL هو إطار عمل تدريبي مبتكر يُعيد تعريف جودة الوصف من خلال التطبيق العملي: فالأوصاف عالية الجودة تُمكّن نماذج اللغة غير المرئية من الإجابة بدقة على أسئلة حول الصورة المقابلة. يستخدم هذا الإطار عمليةً منفصلةً من مرحلتين، حيث يُولّد نموذج لغة بصرية كبير (LVLM) الوصف، بينما تُستمدّ المكافأة الموضوعية من دقة نموذج لغة بصرية كبير (LLM) منفصل في الإجابة على أسئلة الاختيار من متعدد بناءً على هذا الوصف. بعد تدريبه مسبقًا على مجموعة بيانات وصف CapRL-5M المُعلّق عليها باستخدام CapRL-3B، يُحقق CapRL تحسيناتٍ كبيرةً عبر 12 معيارًا. علاوةً على ذلك، ضمن إطار Prism لتقييم جودة الوصف، يُضاهي أداؤه أداء Qwen2.5-VL-72B، متفوقًا على خط الأساس بمتوسط 8.41 TP3T.

Build AI with AI
From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.