التاريخ

منذ 7 أشهر

المؤسسة

رابط الورقة البحثية

2504.19599

الوسوم

تم اقتراح تحسين سياسة تباين المجموعة (GVPO) من قبل فريق Zuoyebang بالتعاون مع جامعة هونج كونج للعلوم والتكنولوجيا (قوانغتشو) في أبريل 2025. وقد نُشرت نتائج البحث ذات الصلة في الورقة البحثية "...".GVPO: تحسين سياسة تباين المجموعة لنموذج اللغة الكبير بعد التدريب"، تم قبولها بواسطة NeurIPS 2025.

يُدمج GVPO الحل التحليلي لتعظيم المكافأة المقيدة بـ KL مباشرةً في أوزان التدرج، مما يضمن التوافق مع السياسة المثلى. تُقدم هذه الطريقة تفسيرًا فيزيائيًا بديهيًا: يعكس تدرجها متوسط مربع الخطأ بين المسافة الضمنية لمركز المكافأة والمسافة الفعلية لمركز المكافأة. يتميز GVPO بميزتين رئيسيتين: أولًا، يضمن حلًا مثاليًا فريدًا، وهو هدف تعظيم المكافأة المقيدة بـ KL؛ ثانيًا، يدعم توزيعات العينات المرنة، متجنبًا القيود التي تفرضها السياسة وأخذ العينات حسب الأهمية.

تمريرة أمامية مُفككة (DePass)

تُستخدم DePass لتفسير نموذج Transformer عن طريق تحليل المرور الأمامي.

منذ 3 أشهر

طريقة مقارنة السلامة: تنبيهات السلامة البصرية المتوافقة بعمق

يحل هذا النظام بفعالية التحديات الرئيسية في عملية المحاذاة الآمنة لـ LVLM.

منذ 3 أشهر

استراتيجية متوسط السرعة (MVP)

يحقق MVP توليد الحركة بخطوة واحدة مع كل من القدرة التعبيرية العالية والحساب السريع للغاية من خلال نمذجة مجال السرعة المتوسط.

منذ 2 أشهر

حساء الخبراء في فئة SoCE

SoCE هو نموذج لتحسين النماذج يعتمد على آلية اختيار الخبراء التلقائية الواعية بالفئات ويتم دمجه مع مهام قياس الأداء المتعددة.

منذ 3 أشهر

رسم شجرة فك تشفير رمز الرسالة المتفرقة

من خلال الاستفادة من التوازي في وحدة معالجة الرسومات لتوسيع شجرة فك التشفير بكفاءة، يتم تحقيق تحسين سريع وقابل للتوسع لمسار الاستدلال.

منذ 3 أشهر

طريقة التعرف على بصمات الأصابع iSeal

يحقق iSeal معدل نجاح بصمة 100% (FSR) ضد أكثر من 10 هجمات على 12 LLMs.

منذ 3 أشهر

نموذج العمل العالمي (وام)

WAM عبارة عن بنية نموذجية أساسية جديدة للذكاء الاصطناعي في مجالات الذكاء المجسد والروبوتات.

منذ شهر واحد

وورلد جين

يتمتع برنامج WorldGen بالقدرة على إنشاء عوالم عرض في الوقت الفعلي موحدة هندسيًا وغنية بصريًا وعالية الكفاءة.

منذ 3 أشهر

نموذج حساء

يمكن لتقنية "Model Souping" توليد نموذج أفضل عن طريق حساب متوسط أوزان عمليات الضبط الدقيق المتعددة.

منذ 3 أشهر

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا

سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين

مدعوم بواسطة MailChimp

Command Palette

تحسين استراتيجية تباين المجموعة GVPO

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

تحسين استراتيجية تباين المجموعة GVPO

ذات صلة ويكي

تمريرة أمامية مُفككة (DePass)

طريقة مقارنة السلامة: تنبيهات السلامة البصرية المتوافقة بعمق

استراتيجية متوسط السرعة (MVP)

حساء الخبراء في فئة SoCE

رسم شجرة فك تشفير رمز الرسالة المتفرقة

طريقة التعرف على بصمات الأصابع iSeal

نموذج العمل العالمي (وام)

وورلد جين

نموذج حساء

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

تحسين استراتيجية تباين المجموعة GVPO

ذات صلة ويكي

تمريرة أمامية مُفككة (DePass)

طريقة مقارنة السلامة: تنبيهات السلامة البصرية المتوافقة بعمق

استراتيجية متوسط السرعة (MVP)

حساء الخبراء في فئة SoCE

رسم شجرة فك تشفير رمز الرسالة المتفرقة

طريقة التعرف على بصمات الأصابع iSeal

نموذج العمل العالمي (وام)

وورلد جين

نموذج حساء

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

ذات صلة ويكي

تمريرة أمامية مُفككة (DePass)

طريقة مقارنة السلامة: تنبيهات السلامة البصرية المتوافقة بعمق

استراتيجية متوسط السرعة (MVP)

حساء الخبراء في فئة SoCE

رسم شجرة فك تشفير رمز الرسالة المتفرقة

طريقة التعرف على بصمات الأصابع iSeal

نموذج العمل العالمي (وام)

وورلد جين

نموذج حساء

ذات صلة ويكي

تمريرة أمامية مُفككة (DePass)

طريقة مقارنة السلامة: تنبيهات السلامة البصرية المتوافقة بعمق

استراتيجية متوسط السرعة (MVP)

حساء الخبراء في فئة SoCE

رسم شجرة فك تشفير رمز الرسالة المتفرقة

طريقة التعرف على بصمات الأصابع iSeal

نموذج العمل العالمي (وام)

وورلد جين

نموذج حساء