HyperAIHyperAI

Command Palette

Search for a command to run...

تدفق FInC: تلافيف k×kk \times kk×k سريعة وقابلة للعكس لتدفقات التطبيع

Aditya Kallappa Sandeep Nagar Girish Varma

الملخص

لقد أصبحت التحويلات العكسية (invertible convolutions) عنصراً أساسياً في بناء نماذج توليدية تعتمد على التدفق الطبيعي التعبيري منذ إدخالها في نموذج Glow. تم بذل العديد من المحاولات لتصميم تحويلات عكسية من نوع k×kk \times kk×k تكون فعّالة في مراحل التدريب والعينة. وعلى الرغم من أن هذه المحاولات ساهمت في تحسين التعبيرية وفعالية العينة، إلا أنها تبقي على تأخير كبير مقارنة بنموذج Glow، الذي استخدم فقط تحويلات من نوع 1×11 \times 11×1 من حيث زمن العينة. بالإضافة إلى ذلك، فإن العديد من النهج تُخفي عدداً كبيراً من المعاملات القابلة للتعلم في التحويل الأساسي، مما يؤدي إلى تقليل التعبيرية ضمن ميزانية زمنية ثابتة. نقترح طبقة تحويلية من نوع k×kk \times kk×k وبنية جديدة لتدفق التطبيع العميق (Deep Normalizing Flow) تتميز بـ:أ) خوارزمية عكس متوازية سريعة بزمن تشغيل O(nk2)O(n k^2)O(nk2) (حيث nnn تمثل الارتفاع والعرض للصورة المدخلة، وkkk هو حجم النواة)،ب) تقليل الحد الأدنى من عدد المعاملات القابلة للتعلم التي تُخفيها الطبقة،ج) تقديم أداء أفضل في المرحلة الأمامية (forward pass) ووقت العينة، مقارنةً بنماذج أخرى تعتمد على تحويلات k×kk \times kk×k، على معايير واقعية.نقدم تنفيذاً لخوارزمية العينة المتوازية المقترحة باستخدام التحويلات العكسية لدينا على وحدات معالجة الرسوميات (GPU). أظهرت النتائج على مجموعات بيانات CIFAR-10، ImageNet، وCelebA أداءً مماثلاً للنماذج السابقة من حيث عدد البتات لكل بعد (bits per dimension)، مع تحسين ملحوظ في زمن العينة.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp