HyperAI
Back to Headlines

تعظيم FLUX.1 كونتكت للتعديل على الصور مع التكميم منخفض الدقة --- تسريع NVIDIA RTX AI لـ FLUX.1 كونتكت متاح الآن للتحميل

منذ 7 أيام

ملخص رئيسي النموذج FLUX.1 Kontext [dev] هو إضافة مثيرة للنماذج المتاحة مجتمعياً لتكوين الصور، وتم تطويره بعناية من قبل Black Forest Labs ليكون أداة رائدة في مجال تحرير الصور تدريجياً. يختلف هذا النموذج عن الأساليب التقليدية التي تعتمد على كتابة تعليمات معقدة وإدخال أقنعة أو خرائط عمق وحواف، حيث يقدم تجربة مستخدم أكثر بساطة ومرونة. يمكن للأفراد الآن تحرير الصور بشكل تدريجي باستخدام النصوص البسيطة، مما يسهل عملية التحرير ويحفظ سلامة المحتوى الأصلي للصورة في جميع المراحل. تعاون NVIDIA مع Black Forest Labs لتحسين أداء النموذج FLUX.1 Kontext [dev] على بطاقات GPU من سلسلة NVIDIA RTX باستخدام NVIDIA TensorRT وتقنيات الكميّة لتقليل متطلبات الذاكرة العشوائية VRAM وتوفير استدلال أسرع. هذا التعاون يأتي ضمن الجهود السابقة التي قام بها NVIDIA لتعزيز أداء النماذج باستخدام تقنية FP4 في بطاقات GeForce RTX ٥٠ Series و FP8 في بطاقات GeForce RTX ٤٠ Series. أدوات التحسين المستخدمة تشمل NVIDIA TensorRT Model Optimizer لتوفير الكميّة و TensorRT لتوفير استدلال الرuntime ودمج العمليات الحسابية. يتألف النموذج FLUX.1 [dev] من عدة وحدات رئيسية، مثل الهيكل الخلفي للتحولات البصرية والكودر الذاتي و CLIP و T5. يختلف FLUX.1 Kontext [dev] عن النماذج الأخرى، مثل FLUX.1-Deph-dev، بتحويل الصور الورادية إلى رموز ثم ربطها بالرموز المستخدمة في عملية الانتشار. هذا الخيار التصميمي يؤدي إلى زيادة طول نافذة السياق بشكل كبير، مما يزيد من متطلبات الذاكرة والحاجة إلى عمليات حسابية أكثر. وجدت التجارب الأولى أن وحدة التحويل هي التي تستهلك حوالي ٩٦٪ من وقت المعالجة، مما يجعلها هدفاً مثالياً للتحسين. من الناحية التقنية، اعتمد فريق البحث على استراتيجيات الكميّة لتحسين أداء وحدة الانتباه SPDA. تم تطبيق هذه الاستراتيجية على كلاً من النسخ FP8 و FP4، مع اختلاف الدقة المستخدمة لعمليات Query و Key و Value. وجد أن التحويل من الدقة الكاملة إلى FP8 يوفر تحسينات كبيرة في الأداء، بينما كانت التحسينات من FP4 أقل نسبياً بسبب زيادة متطلبات الحوسبة لوحدة الانتباه عند استخدام نافذة سياق أطول. من حيث الأداء، أظهرت التجارب أن النموذج الكمي في الدقة FP4 يستهلك حوالي ٢٧٣ ميلي ثانية لكل خطوة انتشار على بطاقة NVIDIA RTX ٥٠٩٠، بينما يستغرق النموذج الكمي في الدقة FP8 حوالي ٣٥٨ ميلي ثانية وبطاقة BF16 حوالي ٦٦٩ ميلي ثانية. كما أدى استخدام الكمي في الدقة منخفضة إلى توفير حوالي ٢-٣ ضعف الذاكرة العشوائية المطلوبة، مما يجعل النموذج أكثر قابلية للتطبيق على البطاقات الرسومية المتوفرة للمستهلكين. رسالة سياقية تعتبر Black Forest Labs من أهم مختبرات البحث في الذكاء الاصطناعي في العالم، وقد حازت نماذجها FLUX.1 على اهتمام عالمي لما توفره من صور عالية الجودة واتباع دقيق للتعليمات. النموذج الجديد FLUX.1 Kontext يغير الطريقة التي يتعامل بها المستخدمون مع عملية تكوين الصور وتحريرها، مما يفتح آفاقاً جديدة للإبداع وتبسيط العمليات. التأثيرات الأوسع لهذا النموذج تتمثل في توفير تجربة مستخدم أكثر تفاعلية وفعالية، حيث يمكن للمبدعين والمبرمجين استخدامه مباشرة من أجهزتهم المحلية المدعومة بـ RTX. هذا التعاون بين NVIDIA و Black Forest Labs يعزز الوصول إلى التقنيات المتطورة في الذكاء الاصطناعي ويقلل من تكاليف الاستدلال ويزيد من الكفاءة. من خلال تبسيط العمليات وتوفير أدوات موثوقة مثل TensorRT Model Optimizer و TensorRT، يتم تمكين المستخدمين من تحقيق تجارب تحرير صور مبتكرة وعالية الجودة.

Related Links