HyperAIHyperAI

Command Palette

Search for a command to run...

منذ 8 أيام

مثال خطوة بخطوة، تحسين حسب القطعة: GRPO على مستوى القطعة للتحويل النصي إلى صورة

Yifu Luo Penghui Du Bo Li Sinan Du Tiantian Zhang Yongzhe Chang Kai Wu Kun Gai Xueqian Wang

مثال خطوة بخطوة، تحسين حسب القطعة: GRPO على مستوى القطعة للتحويل النصي إلى صورة

الملخص

أظهرت طريقة التحسين السياسوي النسبي المجموعة (GRPO) إمكانات قوية في توليد الصور من النص (T2I) القائمة على مطابقة التدفق، لكنها تواجه قيودًا رئيسية: توزيع غير دقيق للفائدة (advantage attribution)، وتجاهل الديناميات الزمنية لعملية التوليد. في هذا العمل، نُقدّم رأيًا مفاده أن تغيير نموذج التحسين من المستوى الخطوي إلى المستوى المجمّع (chunk-level) يمكن أن يُخفف فعّالًا من هذه المشكلات. بالاعتماد على هذه الفكرة، نُقدّم "Chunk-GRPO"، وهي أول منهجية قائمة على GRPO على المستوى المجمّع لتوليد الصور من النص. وتعتمد الفكرة على تجميع الخطوات المتتالية في مجموعات متماسكة تُسمى "أجزاء" (chunks)، تُمثّل الديناميات الزمنية الجوهرية لمطابقة التدفق، مع تحسين السياسات على مستوى هذه الأجزاء. علاوةً على ذلك، نُقدّم استراتيجية عينية موزونة اختيارية لتعزيز الأداء بشكل إضافي. أظهرت التجارب الواسعة أن Chunk-GRPO تحقق نتائج متفوّقة من حيث مطابقة التفضيلات ونوعية الصور، مما يُبرز القدرة الواعدة لنهج التحسين على المستوى المجمّع بالنسبة للمناهج القائمة على GRPO.

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة المشتركة بالذكاء الاصطناعي
وحدات معالجة رسومات جاهزة
أفضل الأسعار
ابدأ الآن

Hyper Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
مثال خطوة بخطوة، تحسين حسب القطعة: GRPO على مستوى القطعة للتحويل النصي إلى صورة | الأوراق البحثية | HyperAI