
摘要
胶囊网络是一种最近提出的神经网络类型,已被证明在具有挑战性的形状识别任务中优于其他方法。在胶囊网络中,标量神经元被替换为胶囊向量或矩阵,其元素代表对象的不同属性。对象及其组成部分之间的关系通过可训练的视角不变转换矩阵进行学习,而某个特定对象的存在则由其组成部分投票的一致性水平决定。这种交互发生在胶囊层之间,称为“一致性路由”(routing-by-agreement)。本文中,我们提出了一种基于变分贝叶斯的新胶囊路由算法,用于拟合变换高斯混合模型,并展示了将我们的胶囊网络转化为胶囊-变分自编码器(Capsule-VAE)的可能性。我们的贝叶斯方法通过建模胶囊姿态参数的不确定性来解决最大似然估计(MLE)模型的一些固有弱点,例如方差崩溃问题。我们在使用比先前报告少50%的胶囊数量的情况下,在smallNORB数据集上超过了现有最佳性能,并在CIFAR-10、Fashion-MNIST和SVHN数据集上取得了具有竞争力的结果,同时在MNIST到affNIST的泛化能力方面相比之前的工作有了显著提升。