摘要
本文提出了一种改进的高效胶囊网络(Capsule Network, CN)模型,用于Kuzushiji-MNIST与Kuzushiji-49基准数据集的分类任务。胶囊网络作为深度学习领域的一种有前景的方法,相较于传统的卷积神经网络(CNN),在鲁棒性、泛化能力以及网络结构简洁性方面具有显著优势。所提出的模型基于Efficient CapsNet架构,引入了自注意力路由机制,从而在提升模型效率的同时显著减少了参数量。在Kuzushiji-MNIST与Kuzushiji-49数据集上的实验结果表明,该模型在两项基准测试中均取得了具有竞争力的性能,排名进入前十大解决方案。尽管所提模型使用的参数量远少于部分排名更高的竞争方法,其分类准确率仍保持相当水平,与最优结果的差距分别仅为0.91%和1.97%。此外,该模型实现优异性能所需的训练时间大幅缩短,使其能够在非专用工作站上完成训练。本文提出的胶囊网络结构创新,包括自注意力机制的融合与高效的网络设计,共同推动了模型在效率与性能上的双重提升。研究结果充分展示了胶囊网络在字符分类任务中作为更高效、更有效方法的巨大潜力,并为该技术在多个领域的广泛应用提供了有力支持。