2 个月前

带有指数线性单元的深度残差网络

Anish Shah; Eashan Kadam; Hena Shah; Sameer Shinde; Sandip Shingade
带有指数线性单元的深度残差网络
摘要

非常深的卷积神经网络引入了诸如梯度消失和退化等问题。近年来,为了解决这些问题,残差网络(Residual Networks)和高速公路网络(Highway Networks)做出了重要贡献。这些网络通过引入跳跃连接(skip connections),使得信息(来自输入或早期层学习到的信息)能够更多地流向深层。这些非常深的模型在诸如ImageNet和COCO等基准测试中显著降低了测试错误率。在本文中,我们提出在残差网络中使用指数线性单元(Exponential Linear Unit, ELU)替代ReLU和批量归一化(Batch Normalization)的组合。我们证明,这不仅加速了残差网络中的学习过程,而且随着深度的增加,还提高了准确性。它在几乎所有数据集上都改善了测试错误率,例如CIFAR-10和CIFAR-100。

带有指数线性单元的深度残差网络 | 最新论文 | HyperAI超神经