Command Palette
Search for a command to run...
USO: توليد موحد يعتمد على الأسلوب والموضوع من خلال تعلّم منفصل ومراعاة المكافآت
USO: توليد موحد يعتمد على الأسلوب والموضوع من خلال تعلّم منفصل ومراعاة المكافآت
Shaojin Wu Mengqi Huang Yufeng Cheng Wenxu Wu Jiahe Tian Yiming Luo Fei Ding Qian He
الملخص
تُعامل الأدبيات الحالية عادةً توليد الأسلوب وتمييز الموضوع كمهمتين منفصلتين: ففي المهمة الأولى تُولَّى الأهمية للتشابه الأسلوبي، بينما في الثانية يُشدد على ثبات الموضوع، مما يؤدي إلى تعارض واضح بينهما. نحن نجادل بأن يمكن تحقيق التوحيد بين هذين الهدفين ضمن إطار واحد، نظرًا لأن كليهما يرتبطان في النهاية بفصل المحتوى عن الأسلوب وإعادة تركيبهما، وهي قضية مركّزة منذ زمن طويل في الأبحاث المتعلقة بالتوليد القائم على الأسلوب. من أجل تحقيق ذلك، نقدّم نموذج USO، وهو نموذج موحد للتحسين المخصص بناءً على الأسلوب والموضوع. أولاً، نبني مجموعة بيانات كبيرة من ثلاثيات (ثلاثية الصور) تتضمن صورًا للمحتوى، وصورًا للأسلوب، وصورًا مُصاغة أسلوبيًا مُقابلة لها. ثانيًا، نقدّم خطة تعلّم منفصلة (disentangled learning) تُعدّل في آنٍ واحد ميزات الأسلوب وتفصل المحتوى عن الأسلوب من خلال هدفين متكاملين: تدريب التماثل الأسلوبي (style-alignment training) وتدريب فصل المحتوى عن الأسلوب (content-style disentanglement training). ثالثًا، ندمج نموذجًا للتعلم المكافئ الأسلوبي يُشار إليه بـ SRL (Style Reward-Learning) لتعزيز أداء النموذج بشكل إضافي. وأخيرًا، نُطلق USO-Bench، وهي أول معايير تقييم تُقيّم بشكل متكامل تشابه الأسلوب ودقة الموضوع عبر عدة مقاييس. تُظهر التجارب الواسعة أن نموذج USO يحقق أفضل الأداء بين النماذج المفتوحة المصدر من حيث كلا البعدين: ثبات الموضوع وتشابه الأسلوب. الكود والنماذج: https://github.com/bytedance/USO