منذ 2 أشهر
شبكات العصبيات التكرارية البكسلية
Aaron van den Oord; Nal Kalchbrenner; Koray Kavukcuoglu

الملخص
نمذجة توزيع الصور الطبيعية هي مشكلة بارزة في التعلم غير المشرف. تتطلب هذه المهمة نموذج صورة يكون في الوقت نفسه معبّرًا، قابلًا للحل وقابلًا للتوسيع. نقدم شبكة عصبية عميقة تقوم بتوقع البكسلات في الصورة تباعيًا على طول البعدين المكانيين. يُعدّ أسلوبنا هذا نموذج احتمال منفصل للقيم الأولية لبكسلات الصورة ويقوم بترميز مجموعة كاملة من الارتباطات داخل الصورة. تشمل الابتكارات الهيكلية طبقات متكررة ثنائية الأبعاد سريعة واستخدام فعال للروابط المتبقية في الشبكات العصبية المتكررة العميقة. حققنا درجات احتمالية تسجيلية على الصور الطبيعية أفضل بكثير من الحالة السابقة لأفضل ما تم الوصول إليه. كما أن نتائجنا الرئيسية توفر مقاييس مرجعية على مجموعة بيانات ImageNet المتنوعة. تبدو العينات التي تم إنشاؤها بواسطة النموذج واضحة، متنوعة ومتناسقة بشكل عام.