8 天前

Xception:深度可分离卷积的深度学习

{Francois Chollet}
Xception:深度可分离卷积的深度学习
摘要

我们提出了一种对卷积神经网络中Inception模块的新解释:Inception模块可被视为常规卷积与深度可分离卷积(depthwise separable convolution,即先进行深度卷积,再进行逐点卷积)之间的一个中间步骤。从这一视角来看,深度可分离卷积可被理解为具有最大数量“塔式结构”(towers)的Inception模块。基于这一观察,我们提出了一种受Inception启发的新型深度卷积神经网络架构,其中原有的Inception模块被深度可分离卷积所取代。实验结果表明,该架构(命名为Xception)在ImageNet数据集上的表现略优于专为该数据集设计的Inception V3;在包含3.5亿张图像和17,000个类别的更大规模图像分类数据集上,Xception显著超越Inception V3。值得注意的是,Xception与Inception V3具有相同数量的参数,因此其性能提升并非源于模型容量的增加,而是得益于对模型参数更高效的利用。

Xception:深度可分离卷积的深度学习 | 最新论文 | HyperAI超神经