17 天前

矩阵胶囊及其EM路由

{Geoffrey E. Hinton, Sara Sabour, Nicholas Frosst}
矩阵胶囊及其EM路由
摘要

胶囊(capsule)是一组神经元,其输出共同表征同一实体的不同属性。胶囊网络中的每一层都包含多个胶囊。我们提出的一种胶囊结构中,每个胶囊包含一个逻辑单元(logistic unit),用于表示某一实体的存在性,以及一个4×4的矩阵,用于学习该实体与观察者之间的关系(即姿态,pose)。位于某一层的胶囊通过将其自身的姿态矩阵与可训练的、视角不变的变换矩阵相乘,向其上一层中多个不同胶囊的姿态矩阵发出“投票”。每项投票均被一个分配系数加权。这些分配系数通过期望最大化(Expectation-Maximization, EM)算法在每幅图像上迭代更新,使得每个胶囊的输出被路由至上一层中接收到一组相似投票的胶囊。变换矩阵通过在相邻胶囊层之间展开EM迭代过程并进行反向传播来实现判别式训练。在smallNORB基准测试中,胶囊网络相较于当前最先进的方法,将测试错误率降低了45%。此外,胶囊网络对白盒对抗攻击的鲁棒性也显著优于我们所采用的基准卷积神经网络。