摘要
神经网络是分类物体图像的一种强大工具。本文提出了一种结合卷积神经网络(CNN)与支持向量机(SVM)的物体图像类别分类方法。采用一个预训练的卷积神经网络——AlexNet作为模式特征提取器。AlexNet已在大规模物体图像数据集ImageNet上完成预训练,因此在本方法中直接使用其预训练权重,无需重新训练。随后,使用支持向量机(SVM)作为可训练分类器,将AlexNet提取的特征向量输入至SVM进行分类。实验所用的物体图像来自STL-10数据集,共包含10个类别,训练集与测试集样本划分清晰。在训练过程中,利用数据增强技术对STL-10的原始5,000张训练图像进行扩展,生成了30倍于原始数据量的增强样本(即150,000张图像)。增强方法包括基于余弦函数的模式变换、旋转、倾斜以及弹性形变等。其中,余弦函数变换使原始图像模式分别实现左对齐、右对齐、上对齐、下对齐,以及中心对齐与放大处理。实验结果表明,采用余弦函数进行数据增强后,测试误差率由未增强时的16.055%降低至15.620%,降幅达0.435个百分点,验证了该增强策略的有效性。相比之下,仅采用旋转、倾斜或弹性形变等其他增强方法时,测试误差率反而高于未增强的情况。最终,在8,000张测试样本上的实验误差率为15.620%,充分说明数据增强技术在图像类别分类任务中具有显著提升作用。