
摘要
深度卷积神经网络在架构设计策略的辅助下,广泛采用数据增强技术以及具有大量特征图的网络层,以嵌入对象的各类变换。然而,这种机制效率极低,尤其在处理大规模数据集时,会导致特征检测器出现大量冗余。尽管胶囊网络(Capsule Networks)尚处于发展初期,但其已被视为扩展现有卷积网络的有前景方向,有望为人工视觉感知引入一种更高效编码所有特征仿射变换的机制。事实上,一个设计合理的胶囊网络理论上应能凭借其固有的泛化能力,在显著减少参数量的情况下实现更优性能。然而,这一关键特性迄今仍鲜受关注。本文系统研究了胶囊网络的效率问题,并通过构建一种极端精简的架构(参数量仅约16万),在不牺牲性能的前提下,证明该架构仅需原始CapsNet约2%的参数量,即可在三个不同数据集上达到当前最优水平。此外,我们提出一种新型非迭代、高度可并行化的路由算法,取代传统的动态路由机制,能够有效应对胶囊数量大幅减少的情况。大量实验对比验证了所提方法的有效性,充分展示了胶囊网络在高效嵌入更具泛化能力的视觉表征方面的潜力。