Command Palette
Search for a command to run...
مثال خطوة بخطوة، تحسين حسب القطعة: GRPO على مستوى القطعة للتحويل النصي إلى صورة
Yifu Luo Penghui Du Bo Li Sinan Du Tiantian Zhang Yongzhe Chang Kai Wu Kun Gai Xueqian Wang

الملخص
أظهرت طريقة التحسين السياسوي النسبي المجموعة (GRPO) إمكانات قوية في توليد الصور من النص (T2I) القائمة على مطابقة التدفق، لكنها تواجه قيودًا رئيسية: توزيع غير دقيق للفائدة (advantage attribution)، وتجاهل الديناميات الزمنية لعملية التوليد. في هذا العمل، نُقدّم رأيًا مفاده أن تغيير نموذج التحسين من المستوى الخطوي إلى المستوى المجمّع (chunk-level) يمكن أن يُخفف فعّالًا من هذه المشكلات. بالاعتماد على هذه الفكرة، نُقدّم "Chunk-GRPO"، وهي أول منهجية قائمة على GRPO على المستوى المجمّع لتوليد الصور من النص. وتعتمد الفكرة على تجميع الخطوات المتتالية في مجموعات متماسكة تُسمى "أجزاء" (chunks)، تُمثّل الديناميات الزمنية الجوهرية لمطابقة التدفق، مع تحسين السياسات على مستوى هذه الأجزاء. علاوةً على ذلك، نُقدّم استراتيجية عينية موزونة اختيارية لتعزيز الأداء بشكل إضافي. أظهرت التجارب الواسعة أن Chunk-GRPO تحقق نتائج متفوّقة من حيث مطابقة التفضيلات ونوعية الصور، مما يُبرز القدرة الواعدة لنهج التحسين على المستوى المجمّع بالنسبة للمناهج القائمة على GRPO.
بناء الذكاء الاصطناعي بالذكاء الاصطناعي
من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.