SRPO: توليد الصور يقول وداعا للذكاء الاصطناعي!
1. مقدمة البرنامج التعليمي

SRPO هو نموذج لتوليد النصوص إلى صور، أُطلق بالتعاون بين فريق Tencent Hunyuan، وكلية العلوم في الجامعة الصينية في هونغ كونغ، شنتشن، وكلية شنتشن الدولية للدراسات العليا في جامعة تسينغهوا في سبتمبر 2025. بتصميم إشارة المكافأة كإشارة نصية مشروطة، يُمكّن النموذج من تعديل المكافأة عبر الإنترنت، ويُقلل الاعتماد على الضبط الدقيق للمكافأة دون اتصال بالإنترنت. يُقدم SRPO تقنية Direct-Align، التي تُعيد الصورة الأصلية مباشرةً من أي خطوة زمنية عبر إعدادات تشويش مُحددة مُسبقًا، مُتجنبةً بذلك مشكلة الإفراط في التحسين في الخطوات الزمنية اللاحقة. تُظهر التجارب على نموذج FLUX.1.dev أن SRPO يُمكنه تحسين الواقعية والجودة الجمالية المُقيّمة من قِبل البشر للصور المُولّدة بشكل كبير، كما أن كفاءة التدريب عالية للغاية، ويمكن إكمال التحسين في 10 دقائق فقط. نتائج البحث ذات الصلة هي:محاذاة مسار الانتشار الكامل بشكل مباشر مع التفضيلات البشرية الدقيقة".
يستخدم هذا البرنامج التعليمي وحدة معالجة رسومية واحدة من طراز A6000 كمورد حاسوبي. يدعم هذا الطراز حاليًا التوجيهات باللغة الإنجليزية فقط.
2. عرض التأثير

3. خطوات التشغيل
1. ابدأ تشغيل الحاوية
إذا تم عرض "بوابة سيئة"، فهذا يعني أن النموذج قيد التهيئة. نظرًا لأن النموذج كبير الحجم، يرجى الانتظار لمدة 2-3 دقائق وتحديث الصفحة.

2. خطوات الاستخدام

المعلمات المحددة:
- المطالبة: يمكنك إدخال وصف نصي هنا.
- العرض: عرض الصورة.
- الارتفاع: ارتفاع الصورة.
- مقياس التوجيه: مقياس التوجيه، المستخدم للتحكم في تأثير مطالبات النص على النتيجة النهائية أثناء إنشاء الصورة.
- خطوات الاستدلال: يتحكم عدد خطوات الاستدلال في عدد تكرارات عملية التوليد، مما يؤثر على جودة التوليد ووقت الحساب.
- البذرة: بذرة رقم عشوائي، تستخدم للتحكم في القيمة الأولية لعملية توليد العشوائية.
- البذور المستخدمة: البذور المستخدمة.
4. المناقشة
🖌️ إذا رأيت مشروعًا عالي الجودة، فيرجى ترك رسالة في الخلفية للتوصية به! بالإضافة إلى ذلك، قمنا أيضًا بتأسيس مجموعة لتبادل الدروس التعليمية. مرحبًا بالأصدقاء لمسح رمز الاستجابة السريعة وإضافة [برنامج تعليمي SD] للانضمام إلى المجموعة لمناقشة المشكلات الفنية المختلفة ومشاركة نتائج التطبيق↓

معلومات الاستشهاد
معلومات الاستشهاد لهذا المشروع هي كما يلي:
@misc{shen2025directlyaligningdiffusiontrajectory,
title={Directly Aligning the Full Diffusion Trajectory with Fine-Grained Human Preference},
author={Xiangwei Shen and Zhimin Li and Zhantao Yang and Shiyi Zhang and Yingfang Zhang and Donghao Li and Chunyu Wang and Qinglin Lu and Yansong Tang},
year={2025},
eprint={2509.06942},
archivePrefix={arXiv},
primaryClass={cs.AI},
url={https://arxiv.org/abs/2509.06942},
}