
摘要
我们训练了一个大型深度卷积神经网络,用于将ImageNet LSVRC-2010数据集中的130万张高分辨率图像分类为1000个不同类别。在测试数据上,我们取得了39.7%的Top-1错误率和18.9%的Top-5错误率,显著优于此前的最先进水平。该神经网络包含6000万个参数和50万个神经元,由五个卷积层组成,其中部分卷积层后接最大池化层,并包含两个全局连接层,最后通过一个1000路Softmax层输出分类结果。为加快训练速度,我们采用了非饱和激活函数,并实现了高效的GPU卷积网络计算。为减少全局连接层中的过拟合现象,我们引入了一种新的正则化方法,实验证明该方法极为有效。