Command Palette
Search for a command to run...
SRPO: توليد الصور يقول وداعا للذكاء الاصطناعي!
Date
Size
2.71 MB
License
Other
GitHub
Paper URL
1. مقدمة البرنامج التعليمي

SRPO هو نموذج لتوليد الصور من النصوص، أُطلق في سبتمبر 2025 بالتعاون بين فريق تينسنت هونيوان، وكلية العلوم بالجامعة الصينية في هونغ كونغ، شنتشن، وكلية الدراسات العليا الدولية بجامعة تسينغهوا في شنتشن. يُتيح تصميم إشارة المكافأة كإشارة مشروطة بالنص، تعديل المكافأة بشكل فوري، مما يقلل الاعتماد على ضبطها لاحقًا. يستخدم SRPO تقنية Direct-Align لاستعادة الصورة الأصلية مباشرةً من أي خطوة زمنية باستخدام معلومات مسبقة عن الضوضاء، متجنبًا الإفراط في التحسين في الخطوات الزمنية اللاحقة. أظهرت التجارب على نموذج FLUX.1.dev أن SRPO يُحسّن بشكل ملحوظ واقعية وجودة الصور المُولّدة من الناحية الجمالية كما يراها البشر، كما أن كفاءة تدريبه عالية للغاية، إذ لا يتطلب سوى 10 دقائق لإتمام التحسين. تتوفر أوراق بحثية ذات صلة. محاذاة مسار الانتشار الكامل بشكل مباشر مع التفضيلات البشرية الدقيقة .
يستخدم هذا البرنامج التعليمي وحدة معالجة رسومية واحدة من طراز A6000 كمورد حاسوبي. يدعم هذا الطراز حاليًا التوجيهات باللغة الإنجليزية فقط.
2. عرض التأثير

3. خطوات التشغيل
1. ابدأ تشغيل الحاوية
إذا تم عرض "بوابة سيئة"، فهذا يعني أن النموذج قيد التهيئة. نظرًا لأن النموذج كبير الحجم، يرجى الانتظار لمدة 2-3 دقائق وتحديث الصفحة.

2. خطوات الاستخدام

المعلمات المحددة:
- المطالبة: يمكنك إدخال وصف نصي هنا.
- العرض: عرض الصورة.
- الارتفاع: ارتفاع الصورة.
- مقياس التوجيه: مقياس التوجيه، المستخدم للتحكم في تأثير مطالبات النص على النتيجة النهائية أثناء إنشاء الصورة.
- خطوات الاستدلال: يتحكم عدد خطوات الاستدلال في عدد تكرارات عملية التوليد، مما يؤثر على جودة التوليد ووقت الحساب.
- البذرة: بذرة رقم عشوائي، تستخدم للتحكم في القيمة الأولية لعملية توليد العشوائية.
- البذور المستخدمة: البذور المستخدمة.
4. المناقشة
🖌️ إذا رأيت مشروعًا عالي الجودة، فيرجى ترك رسالة في الخلفية للتوصية به! بالإضافة إلى ذلك، قمنا أيضًا بتأسيس مجموعة لتبادل الدروس التعليمية. مرحبًا بالأصدقاء لمسح رمز الاستجابة السريعة وإضافة [برنامج تعليمي SD] للانضمام إلى المجموعة لمناقشة المشكلات الفنية المختلفة ومشاركة نتائج التطبيق↓

معلومات الاستشهاد
معلومات الاستشهاد لهذا المشروع هي كما يلي:
@misc{shen2025directlyaligningdiffusiontrajectory,
title={Directly Aligning the Full Diffusion Trajectory with Fine-Grained Human Preference},
author={Xiangwei Shen and Zhimin Li and Zhantao Yang and Shiyi Zhang and Yingfang Zhang and Donghao Li and Chunyu Wang and Qinglin Lu and Yansong Tang},
year={2025},
eprint={2509.06942},
archivePrefix={arXiv},
primaryClass={cs.AI},
url={https://arxiv.org/abs/2509.06942},
}
Build AI with AI
From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.