الروتين الكبسولي عبر بايز المتغير

الشبكات الكبسولية هي نوع حديث من الشبكات العصبية أثبتت فعاليتها في مهام التعرف على الأشكال الصعبة أكثر من البدائل الأخرى. في هذه الشبكات، يتم استبدال العصبونات السلمية بأشباه كبسولية على شكل متجهات أو مصفوفات، حيث تمثل عناصرها خصائص مختلفة للأجسام. يتم تعلم العلاقات بين الأجسام وأجزائها من خلال مصفوفات تحويل ثابتة النظرة قابلة للتدريب، ويتم تحديد وجود جسم معين بناءً على درجة الاتفاق بين تصويتات أجزائه. يحدث هذا التفاعل بين طبقات الكبسولات وهو عملية تُعرف بالترشيح عن طريق الاتفاق (routing-by-agreement). في هذا البحث، نقترح خوارزمية جديدة لترشيح الكبسولات مشتقة من بايز المتغير لتقدير خليط من الجاوسيات المتحولة، ونوضح إمكانية تحويل شبكتنا الكبسولية إلى كبسولة-VAE (Capsule-VAE). يعالج نهجنا البيزي بعض الضعف المتأصل في النماذج القائمة على تقدير الأرجحية القصوى (MLE) مثل الانهيار التبايني من خلال نمذجة عدم اليقين حول معلمات وضع الكبسولات. حققنا أفضل النتائج الحالية على مجموعة بيانات smallNORB باستخدام 50٪ أقل عددًا من الكبسولات مما تم الإبلاغ عنه سابقًا، وحققنا أداءً تنافسيًا على CIFAR-10 و Fashion-MNIST و SVHN، وأظهرنا تحسينًا كبيرًا في تعميم MNIST إلى affNIST مقارنة بالأبحاث السابقة.