موبيوس: نموذج خفيف يستكمل الصور بأداء نماذج الـ10 مليارات
كشف باحثون من جامعة هواتشونغ للعلوم والتكنولوجيا ومختبر فيفو للذكاء الاصطناعي عن إطار عمل المسمى Moebius، وهو نموذج خفيف الوزن لتصحيح الصور يحتوي على 0.2 مليار معامل فقط. يهدف هذا الإطار إلى تجاوز التحديات الحسابية الهائلة التي تعترض نشر النماذج التأسيسية الصناعية الضخمة التي تتجاوز عشرة مليارات معامل، والتي تواجه غالباً عنق زجاجي في التمثيل عند ضغطها هيكلياً. يعتمد Moebius على إعادة بناء العمود الفقري للانتشار بشكل منهجي، باستخدام كتلة تفاعل مختلط محلية. تدمج هذه الكتلة وحدات خاصة لتلخيص السياقات المكانية والمعرفة الدلالية العامة داخل مصفوفات خطية ثابتة الحجم، مما يحافظ على التفاعلات المعقدة في الفضاء الكامن مع تقليل الأحمال الحسابية بشكل كبير. لتعزيز قدرات النموذج المضغوط، طاق الفريق استراتيجية تبليم متعددة الحبيبات تتكيف ذاتياً، تعمل حصرياً داخل الفضاء الكامن لتجنب تكاليف فك التشفير المكلفة في فضاء البكسل. تقوم هذه الاستراتيجية بموازنة ديناميكية للخسائر المستندة إلى التدرجات لتحقيق محاذاة عالية الدقة مع النماذج المعلمة الأكبر حجماً. أظهرت التجارب الشاملة التي شملت مشاهد طبيعية وملفات صور بورتريه قدرة Moebius على مساواة أو تفوق جودة التوليد الخاصة بنموذج FLUX.1-Fill-Dev الصناعي الضخم الذي يبلغ حجمه 11.9 مليار معامل. يحقق الإطار الجديد هذه النتائج باستخدام أقل من اثنين بالمائة من معاملاته مع تسريع زمن الاستدراج الكلي بأكثر من خمسة عشر ضعفاً. يُعد هذا الإنجاز نقلة نوعية في معايير كفاءة معالجة الصور عالية الدقة، حيث يثبت أن التخصص الدقيق لهيكل خفيف الوزن مدعوم باستراتيجيات تبليم ذكية يمكنه تجاوز عقبات التكلفة الحسابية، مما يفتح آفاقاً أوسع لنشر تقنيات تعديل الصور في البيئات العملية ذات الموارد المحدودة.
