التاريخ

منذ 2 أشهر

المؤسسة

رابط الورقة البحثية

2509.22647

الوسوم

الرؤية الحاسوبية

تم اقتراح مشروع CapRL في سبتمبر 2025 من قِبل فريق بحثي من جامعة العلوم والتكنولوجيا الصينية، وجامعة هونغ كونغ الصينية، ومختبر الذكاء الاصطناعي في شنغهاي، ومؤسسات أخرى. نُشرت نتائج البحث ذات الصلة في ورقة بحثية بعنوان "...".CapRL: تحفيز قدرات كتابة التعليقات التوضيحية للصور الكثيفة من خلال التعلم التعزيزي".

CapRL هو إطار عمل تدريبي مبتكر يُعيد تعريف جودة الوصف من خلال التطبيق العملي: فالأوصاف عالية الجودة تُمكّن نماذج اللغة غير المرئية من الإجابة بدقة على أسئلة حول الصورة المقابلة. يستخدم هذا الإطار عمليةً منفصلةً من مرحلتين، حيث يُولّد نموذج لغة بصرية كبير (LVLM) الوصف، بينما تُستمدّ المكافأة الموضوعية من دقة نموذج لغة بصرية كبير (LLM) منفصل في الإجابة على أسئلة الاختيار من متعدد بناءً على هذا الوصف. بعد تدريبه مسبقًا على مجموعة بيانات وصف CapRL-5M المُعلّق عليها باستخدام CapRL-3B، يُحقق CapRL تحسيناتٍ كبيرةً عبر 12 معيارًا. علاوةً على ذلك، ضمن إطار Prism لتقييم جودة الوصف، يُضاهي أداؤه أداء Qwen2.5-VL-72B، متفوقًا على خط الأساس بمتوسط 8.41 TP3T.

إطار التعلم المعزز Mem-I

لقد حقق Mem-I تحسينات كبيرة مقارنة بالخطوط الأساسية الحالية للوكلاء المحسّنين بالذاكرة في العديد من اختبارات القياس المعيارية.

منذ 2 أشهر

إطار عمل التحكم في التخطيط InstanceAssemble

تتيح تقنية InstanceAssemble توليد صور عالية الجودة وقابلة للتحكم في ظل ظروف متعددة الوسائط.

منذ 2 أشهر

تخمين – فكر – أجب

يتفوق GTA بشكل كبير على خطوط الأساس SFT القياسية وطرق RL المتطورة في معايير تصنيف النصوص المتعددة.

منذ 3 أشهر

RewardMap، إطار عمل للتعلم التعزيزي متعدد المراحل

يعمل RewardMap على تعزيز قدرات نماذج اللغة الكبيرة متعددة الوسائط في مهام الرؤية المنظمة.

منذ 2 أشهر

التحكم في التخطيط - تخطيط إلى صورة

يوفر تخطيط الصورة آلية تحكم مرنة لتوليد الصور.

منذ 2 أشهر

شبكة الخليط الأسّي-الغاوسي EGMN

تمكنت EGMN بنجاح من التقاط تأثيرات التفاعل المحتملة بين تفضيلات المستخدم وميزات الفيديو.

منذ 3 أشهر

طريقة DiDi-Instruct لما بعد التدريب

أول إطار عمل يطبق بنجاح تقطير مطابقة التوزيع على توليد النصوص المستندة إلى MDM، مما أدى إلى تحقيق رقم قياسي في توليد تسلسل اللغة في بضع خطوات.

منذ 2 أشهر

هندسة MultiPL-MoE (لغة برمجة متعددة MoE)

MultiPL-MoE هي طريقة فعالة لتوسيع لغات البرمجة منخفضة المصدر في مرحلة ما بعد التدريب المسبق.

منذ 2 أشهر

إطار عمل تحسين الاستراتيجية الهجينة HiPO

يتم استخدام HiPO لاستدلال LLM التكيفي، بما في ذلك بشكل أساسي إنشاء البيانات الهجينة والتعلم التعزيزي الهجين.

منذ 2 أشهر

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا

سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين

مدعوم بواسطة MailChimp

HyperAI

التاريخ

منذ 2 أشهر

المؤسسة

رابط الورقة البحثية

2509.22647

الوسوم

الرؤية الحاسوبية

إطار التعلم المعزز Mem-I

منذ 2 أشهر

إطار عمل التحكم في التخطيط InstanceAssemble

تتيح تقنية InstanceAssemble توليد صور عالية الجودة وقابلة للتحكم في ظل ظروف متعددة الوسائط.

منذ 2 أشهر

تخمين – فكر – أجب

يتفوق GTA بشكل كبير على خطوط الأساس SFT القياسية وطرق RL المتطورة في معايير تصنيف النصوص المتعددة.

منذ 3 أشهر

RewardMap، إطار عمل للتعلم التعزيزي متعدد المراحل

يعمل RewardMap على تعزيز قدرات نماذج اللغة الكبيرة متعددة الوسائط في مهام الرؤية المنظمة.

منذ 2 أشهر

التحكم في التخطيط - تخطيط إلى صورة

يوفر تخطيط الصورة آلية تحكم مرنة لتوليد الصور.

منذ 2 أشهر

شبكة الخليط الأسّي-الغاوسي EGMN

تمكنت EGMN بنجاح من التقاط تأثيرات التفاعل المحتملة بين تفضيلات المستخدم وميزات الفيديو.

منذ 3 أشهر

طريقة DiDi-Instruct لما بعد التدريب

منذ 2 أشهر

هندسة MultiPL-MoE (لغة برمجة متعددة MoE)

MultiPL-MoE هي طريقة فعالة لتوسيع لغات البرمجة منخفضة المصدر في مرحلة ما بعد التدريب المسبق.

منذ 2 أشهر

إطار عمل تحسين الاستراتيجية الهجينة HiPO

يتم استخدام HiPO لاستدلال LLM التكيفي، بما في ذلك بشكل أساسي إنشاء البيانات الهجينة والتعلم التعزيزي الهجين.

منذ 2 أشهر

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا

سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين

مدعوم بواسطة MailChimp

Command Palette

يصف CapRL التعلم التعزيزي

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

يصف CapRL التعلم التعزيزي

ذات صلة ويكي

إطار التعلم المعزز Mem-I

إطار عمل التحكم في التخطيط InstanceAssemble

تخمين – فكر – أجب

RewardMap، إطار عمل للتعلم التعزيزي متعدد المراحل

التحكم في التخطيط - تخطيط إلى صورة

شبكة الخليط الأسّي-الغاوسي EGMN

طريقة DiDi-Instruct لما بعد التدريب

هندسة MultiPL-MoE (لغة برمجة متعددة MoE)

إطار عمل تحسين الاستراتيجية الهجينة HiPO

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

يصف CapRL التعلم التعزيزي

ذات صلة ويكي

إطار التعلم المعزز Mem-I

إطار عمل التحكم في التخطيط InstanceAssemble

تخمين – فكر – أجب

RewardMap، إطار عمل للتعلم التعزيزي متعدد المراحل

التحكم في التخطيط - تخطيط إلى صورة

شبكة الخليط الأسّي-الغاوسي EGMN

طريقة DiDi-Instruct لما بعد التدريب

هندسة MultiPL-MoE (لغة برمجة متعددة MoE)

إطار عمل تحسين الاستراتيجية الهجينة HiPO

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

ذات صلة ويكي

إطار التعلم المعزز Mem-I

إطار عمل التحكم في التخطيط InstanceAssemble

تخمين – فكر – أجب

RewardMap، إطار عمل للتعلم التعزيزي متعدد المراحل

التحكم في التخطيط - تخطيط إلى صورة

شبكة الخليط الأسّي-الغاوسي EGMN

طريقة DiDi-Instruct لما بعد التدريب

هندسة MultiPL-MoE (لغة برمجة متعددة MoE)

إطار عمل تحسين الاستراتيجية الهجينة HiPO

ذات صلة ويكي

إطار التعلم المعزز Mem-I

إطار عمل التحكم في التخطيط InstanceAssemble

تخمين – فكر – أجب

RewardMap، إطار عمل للتعلم التعزيزي متعدد المراحل

التحكم في التخطيط - تخطيط إلى صورة

شبكة الخليط الأسّي-الغاوسي EGMN

طريقة DiDi-Instruct لما بعد التدريب

هندسة MultiPL-MoE (لغة برمجة متعددة MoE)

إطار عمل تحسين الاستراتيجية الهجينة HiPO