Command Palette
Search for a command to run...
جارفيس آرت - معاينة برنامج تنقيح الصور الذكي
التاريخ
الحجم
11.96 MB
الوسوم
الترخيص
Apache 2.0
GitHub
رابط الورقة البحثية
1. مقدمة البرنامج التعليمي

JarvisArt-Preview هو نموذج ذكي لتعديل الصور، تم إصداره في 24 يونيو 2025 من قبل مؤسسات من بينها جامعة شيامن، وجامعة هونغ كونغ للعلوم والتكنولوجيا (غوانغتشو)، وجامعة تسينغهوا. في اختبار Artistic Retouch Benchmark، حقق هذا النموذج تفوقًا ملحوظًا على Adobe Firefly Retouch في دقة مطابقة التعليمات (68.31 TP3T) وتأثير التعديل الاحترافي (61.51 TP3T) على التوالي. كما حقق أداءً متميزًا في اختبارات تحرير الصور التقليدية، مثل Style Transfer Evaluation Suite واختبار تفضيل المستخدم. علاوة على ذلك، يُظهر النموذج ميزات نادرة في الأنظمة السابقة، تشمل: استدعاءً شاملاً لأكثر من 200 أداة في برنامج Lightroom باستخدام اللغة الطبيعية، ودمجًا ذكيًا لعناصر من أنماط مختلفة (يدعم أنماطًا مختلطة مثل الرسم الزيتي والرسم التخطيطي)، وإمكانية الرجوع إلى خطوات التنقيح بشكل قابل للتفسير (عن طريق إنشاء أوصاف باللغة الطبيعية لكل خطوة)، وتحسينًا تكراريًا ثنائي الاتجاه بين النص والصورة (يصحح تلقائيًا أي انحرافات في التعليمات بناءً على النتائج المُولَّدة). تتوفر أوراق بحثية ذات صلة. جارفيس آرت: تحرير الإبداع الفني البشري من خلال وكيل ذكي لتنقيح الصورتم إدراجه في مؤتمر NeurIPS 2025.
يستخدم هذا الشرح بطاقة رسومات واحدة من نوع RTX 4090. اللغة الإنجليزية هي اللغة الوحيدة المدعومة.
2. أمثلة المشاريع

3. خطوات التشغيل
1. بعد بدء تشغيل الحاوية، انقر فوق عنوان API للدخول إلى واجهة الويب

2. خطوات الاستخدام
إذا ظهرت رسالة "Bad Gateway"، فهذا يعني أن النموذج قيد التهيئة. نظرًا لكبر حجم النموذج، يُرجى الانتظار لمدة دقيقتين إلى ثلاث دقائق ثم تحديث الصفحة. ستحتاج إلى استخدام برنامج Lightroom لعرض الملفات المُنشأة.

وصف المعلمة
- معايير التوليد المتقدمة:
- الحد الأقصى للرموز الجديدة: يحدد هذا الخيار الحد الأقصى لعدد الرموز التي يمكن للنموذج توليدها للنصوص المتعلقة بتحرير الصور (مثل تعليمات التشغيل، ووصف الخطوات، وما إلى ذلك). كلما زادت القيمة، زادت تفاصيل وصف منطق تحرير الصور أو الخطوات المُولَّدة، مما ينتج عنه محتوى إخراج أطول.
- درجة الحرارة: تتحكم في عشوائية استراتيجية تنقيح الصور. كلما انخفضت القيمة (مثلاً، قريبة من 0.1)، كانت أفكار التنقيح الناتجة أكثر استقراراً وقابلية للتنبؤ؛ وكلما ارتفعت القيمة (مثلاً، قريبة من 2)، كانت أفكار التنقيح أكثر تبايناً وتنوعاً، ولكن قد تظهر منطق تعديل غير متوقع.
- أفضل K: في كل خطوة من خطوات التوليد، يتم اختيار المحتوى فقط من بين K من العلامات ذات الاحتمالية الأعلى. كلما كانت القيمة أصغر (مثلاً 10)، كانت تعليمات التنقيح المُولَّدة أكثر تركيزًا وتحفظًا؛ وكلما كانت القيمة أكبر (مثلاً 100)، كان اختيار التعليمات أكثر تنوعًا، مما يسمح بمشاركة المزيد من أفكار التنقيح المحتملة.
- تقنية Top-P (أخذ عينات النواة): تتحكم في تنوع المخرجات باستخدام عتبة احتمالية تراكمية. كلما انخفضت القيمة (مثلاً 0.5)، زادت تركيز منطق تحرير الصور، حيث يتم أخذ العينات من عدد قليل من العلامات ذات الاحتمالية العالية فقط. وكلما ارتفعت القيمة (مثلاً 0.9)، زاد السماح للعلامات ذات الاحتمالية المنخفضة ولكن الإبداعية بالمشاركة، مما ينتج عنه تنوع أكبر في النتائج.
- محافظ / إبداعي / متوازن: اختصارات للتبديل السريع بين مجموعات المعلمات
- يميل الوضع "المحافظ" إلى توليد استراتيجيات تنقيح صور مستقرة ويمكن التنبؤ بها.
- يؤكد الوضع "الإبداعي" على الإبداع المتباين والمتنوع في تحرير الصور؛
- يحقق الوضع "المتوازن" توازناً بين الاستقرار والإبداع.
معلومات الاستشهاد
معلومات الاستشهاد لهذا المشروع هي كما يلي:
@article{jarvisart2025,
title={JarvisArt: Liberating Human Artistic Creativity via an Intelligent Photo Retouching Agent},
author={Yunlong Lin and Zixu Lin and Kunjie Lin and Jinbin Bai and Panwang Pan and Chenxin Li and Haoyu Chen and Zhongdao Wang and Xinghao Ding and Wenbo Li and Shuicheng Yan},
year={2025},
journal={arXiv preprint arXiv:2506.17612}
}
بناء الذكاء الاصطناعي بالذكاء الاصطناعي
من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.