المستندات الكبسولية المتراكمة

الأشياء تتكون من مجموعة أجزاء مرتبة هندسياً. نقدم مُشفِّر كبسولات غير مُشرف (SCAE)، الذي يستخدم بشكل صريح العلاقات الهندسية بين الأجزاء لاستنتاج المعلومات حول الأشياء. نظرًا لأن هذه العلاقات لا تعتمد على الزاوية المرئية، فإن نموذجنا قوي في التعامل مع تغيرات الزاوية المرئية. يتكون SCAE من مرحلتين. في المرحلة الأولى، يتنبأ النموذج بوجود وضعيات قوالب الأجزاء مباشرة من الصورة ويحاول إعادة بناء الصورة عن طريق ترتيب القوالب بشكل مناسب. في المرحلة الثانية، يتنبأ SCAE ب매علمات عدد قليل من الكبسولات الخاصة بالأشياء، والتي يتم استخدامها لإعادة بناء وضعيات الأجزاء. يُجرى الاستدلال في هذا النموذج بطريقة موزعة ويقوم بها مُشفِّرات عصبية جاهزة، على عكس الشبكات الكبسولية السابقة. وجدنا أن وجود كبسولات الأشياء يكون غاية في الإفادة فيما يتعلق بتصنيف الفئة، مما يؤدي إلى نتائج رائدة في تصنيف البيانات غير المُشرفة على SVHN (55%) وMNIST (98.7%). يمكن الوصول إلى الرمز البرمجي عبر الرابط: https://github.com/google-research/google-research/tree/master/stacked_capsule_autoencoders