17 天前

基于混合DWT-DCT与KNN及SVM分类器的手写数字与字母识别

{Preman Ghadekar}
摘要

手写数字与字母识别是模式识别领域中历史最悠久且极为重要的研究课题之一。由于书写风格多样、字符结构相似以及方向角度各异,手写数字与字母识别面临诸多挑战。因此,探索高效、准确的识别与分类方法具有重要意义。该技术在诸多实际场景中具有广泛应用,例如车牌识别、名片信息提取、银行支票处理、邮政地址识别、护照信息处理以及签名验证等。本文提出一种基于混合离散小波变换(Discrete Wavelet Transform, DWT)与离散余弦变换(Discrete Cosine Transform, DCT)的特征提取方法,用于手写数字与字母识别。所提取的特征随后输入K近邻(K-Nearest Neighbour, KNN)与支持向量机(Support Vector Machine, SVM)分类器进行分类。实验采用标准的MNIST手写数字数据集与EMNIST字母数据集。首先对MNIST数字数据集与EMNIST字母数据集进行二值化处理,并去除孤立噪声像素。随后,利用DWT与DCT的混合变换方法提取特征。最终,分别采用KNN与SVM分类器进行分类实验。实验结果表明,所提出的算法在使用SVM分类器时,数字识别准确率最高可达97.74%,字母识别准确率最高可达89.51%。