2 个月前

用于文本分类的深度压缩卷积神经网络

Andréa B. Duque; Luã Lázaro J. Santos; David Macêdo; Cleber Zanchettin
用于文本分类的深度压缩卷积神经网络
摘要

大多数卷积神经网络的研究都集中在通过增加网络深度来提高准确性,这导致了参数数量的大幅增加,从而限制了训练好的网络在具有内存和处理限制的平台上的应用。本文提出对非常深的卷积神经网络(VDCNN)模型的结构进行修改,以适应移动平台的约束条件并保持性能。我们评估了时间深度可分离卷积(Temporal Depthwise Separable Convolutions)和全局平均池化(Global Average Pooling)对网络参数、存储大小和延迟的影响。压缩后的模型(SVDCNN)根据网络深度的不同,其体积缩小了10到20倍,最大体积不超过6MB。在准确性方面,该网络相比基线模型损失了0.4%到1.3%,但获得了更低的延迟。

用于文本分类的深度压缩卷积神经网络 | 最新论文 | HyperAI超神经