HyperAIHyperAI
منذ 17 أيام

تدفق FInC: تلافيف $k \times k$ سريعة وقابلة للعكس لتدفقات التطبيع

Aditya Kallappa, Sandeep Nagar, Girish Varma
تدفق FInC: تلافيف $k \times k$ سريعة وقابلة للعكس لتدفقات التطبيع
الملخص

لقد أصبحت التحويلات العكسية (invertible convolutions) عنصراً أساسياً في بناء نماذج توليدية تعتمد على التدفق الطبيعي التعبيري منذ إدخالها في نموذج Glow. تم بذل العديد من المحاولات لتصميم تحويلات عكسية من نوع $k \times k$ تكون فعّالة في مراحل التدريب والعينة. وعلى الرغم من أن هذه المحاولات ساهمت في تحسين التعبيرية وفعالية العينة، إلا أنها تبقي على تأخير كبير مقارنة بنموذج Glow، الذي استخدم فقط تحويلات من نوع $1 \times 1$ من حيث زمن العينة. بالإضافة إلى ذلك، فإن العديد من النهج تُخفي عدداً كبيراً من المعاملات القابلة للتعلم في التحويل الأساسي، مما يؤدي إلى تقليل التعبيرية ضمن ميزانية زمنية ثابتة. نقترح طبقة تحويلية من نوع $k \times k$ وبنية جديدة لتدفق التطبيع العميق (Deep Normalizing Flow) تتميز بـ:أ) خوارزمية عكس متوازية سريعة بزمن تشغيل $O(n k^2)$ (حيث $n$ تمثل الارتفاع والعرض للصورة المدخلة، و$k$ هو حجم النواة)،ب) تقليل الحد الأدنى من عدد المعاملات القابلة للتعلم التي تُخفيها الطبقة،ج) تقديم أداء أفضل في المرحلة الأمامية (forward pass) ووقت العينة، مقارنةً بنماذج أخرى تعتمد على تحويلات $k \times k$، على معايير واقعية.نقدم تنفيذاً لخوارزمية العينة المتوازية المقترحة باستخدام التحويلات العكسية لدينا على وحدات معالجة الرسوميات (GPU). أظهرت النتائج على مجموعات بيانات CIFAR-10، ImageNet، وCelebA أداءً مماثلاً للنماذج السابقة من حيث عدد البتات لكل بعد (bits per dimension)، مع تحسين ملحوظ في زمن العينة.

تدفق FInC: تلافيف $k \times k$ سريعة وقابلة للعكس لتدفقات التطبيع | أحدث الأوراق البحثية | HyperAI