HyperAIHyperAI
منذ 2 أشهر

تقدير الكثافة التلقائي المتعدد المقياس بالتوازي

Scott Reed; Aäron van den Oord; Nal Kalchbrenner; Sergio Gómez Colmenarejo; Ziyu Wang; Dan Belov; Nando de Freitas
تقدير الكثافة التلقائي المتعدد المقياس بالتوازي
الملخص

يحقق نموذج PixelCNN أفضل النتائج في تقدير الكثافة للصور الطبيعية. رغم أن التدريب سريع، فإن الاستدلال مكلف ويحتاج إلى تقييم شبكة واحد لكل بكسل؛ أي O(N) لـ N بكسل. يمكن تسريع هذا الأمر من خلال تخزين التنشيطات، لكنه لا يزال يتضمن إنشاء كل بكسل بشكل متتابع. في هذا البحث، نقترح نموذج PixelCNN متوازيًا يسمح باستدلال أكثر كفاءة من خلال نمذجة بعض مجموعات البكسل على أنها مستقلة شرطيًا. يحقق نموذجنا الجديد لـ PixelCNN تقدير كثافة تنافسي وتسريع بمقدار عدة درجات - عينات O(log N) بدلاً من O(N) - مما يمكّن من إنشاء صور بحجم 512x512 بشكل عملي. قمنا بتقييم النموذج في إنشاء الصور الشرطي على الفئة، وتحويل النص إلى صورة، وإنشاء الفيديو الشرطي على الحركة، مما أظهر أن نموذجنا حقق أفضل النتائج بين النماذج غير الذاتية الارتباط البكسلية التي تسمح بالعينة الكفؤة.

تقدير الكثافة التلقائي المتعدد المقياس بالتوازي | أحدث الأوراق البحثية | HyperAI