2 个月前

Xception:深度学习中的深度可分离卷积

François Chollet
Xception:深度学习中的深度可分离卷积
摘要

我们对卷积神经网络中的Inception模块进行了解释,认为它们是在常规卷积和深度可分离卷积操作(先进行深度卷积,再进行逐点卷积)之间的中间步骤。在这种视角下,深度可分离卷积可以被理解为具有最大数量塔的Inception模块。基于这一观察,我们提出了一种受Inception启发的新颖深度卷积神经网络架构,其中Inception模块已被深度可分离卷积所替代。我们展示了这种架构,称为Xception,在ImageNet数据集上(该数据集是Inception V3的设计目标)的表现略优于Inception V3,并且在一个包含3.5亿张图像和17,000个类别的更大图像分类数据集上的表现显著优于Inception V3。由于Xception架构与Inception V3具有相同数量的参数,性能提升并非由于模型容量的增加,而是因为更高效地利用了模型参数。