التفكيك المتوازي مع الوعي بالموقع لتحسين توليد الصور الذاتي التتابعي بشكل كفؤ

نقدم تقنية فك التشفير المتوازي الواعية بالموقع (LPD) لتسريع توليد الصور الذاتي الانحدار. يعتمد التوليد الذاتي الانحداري التقليدي للصور على التنبؤ بالشريحة التالية، وهي عملية مقيدة بالذاكرة تؤدي إلى زمن استجابة عالٍ. حاولت الدراسات السابقة توازي التنبؤ بالشريحة التالية من خلال الانتقال إلى التنبؤ بشرائح متعددة لتسريع العملية، لكنها حققت توازيًا محدودًا فقط. لتحقيق درجة عالية من التوازي مع الحفاظ على جودة التوليد، نقدم تقنيتين رئيسيتين:نموذج التحليل الذاتي الانحداري المتوازي المرن، وهو بنية جديدة تسمح بترتيب توليد تعسفي ودرجات متغيرة من التوازي. يستخدم رموز الاستفسار الموضعية القابلة للتعلم لتوجيه التوليد في المواقع المستهدفة مع ضمان الرؤية المتبادلة بين الرموز المتولدة بشكل متزامن لتحقيق فك تشفير متوازي متناسق.جدولة ترتيب التوليد الواعية بالموقع، وهي جدول زمني جديد يشكل مجموعات لتصغير الاعتمادية داخل المجموعة وتعظيم الدعم السياقي، مما يعزز جودة التوليد.بفضل هذه التصاميم، تمكنا من خفض خطوات التوليد من 256 إلى 20 (لصور بدقة 256×256 بكسل) ومن 1024 إلى 48 (لصور بدقة 512×512 بكسل) دون المساس بجودة توليد الصور المشروطة بفئات ImageNet، وحققنا زمن استجابة أقل بمقدار 3.4 مرة على الأقل مقارنة بنماذج الفك الذاتي الانحداري المتوازية السابقة.