17일 전

손글씨 숫자 및 문자 인식을 위한 하이브리드 DWT-DCT 및 KNN, SVM 분류기 활용

{Preman Ghadekar}
초록

손글씨 숫자 및 문자 인식은 패턴 인식 분야에서 가장 오래되고 매우 중요한 주제 중 하나이다. 손글씨 숫자 및 문자 인식은 다양한 글씨 스타일, 구조적 유사성, 방향 각도의 차이 등으로 인해 복잡한 문제를 제기한다. 따라서 숫자 및 문자의 인식과 분류를 위한 효과적인 방법을 찾는 것은 매우 중요하다. 손글씨 숫자 및 문자 인식은 번호판 인식, 명함 정보 추출, 은행 수표 처리, 우편 주소 처리, 여권 처리, 서명 처리 등 다양한 응용 분야에서 활용된다. 본 논문에서는 하이브리드 이산 웨이블릿 변환(Discrete Wavelet Transform, DWT)과 이산 코사인 변환(Discrete Cosine Transform, DCT)을 기반으로 한 특징 추출 기법을 사용하여 손글씨 숫자 및 문자 인식을 수행하는 방법을 제안한다. 추출된 특징은 K-최근접 이웃(K-Nearest Neighbour, KNN) 및 서포트 벡터 머신(Support Vector Machine, SVM) 분류기로 전달되어 분류 작업을 수행한다. 실험은 표준 MNIST 데이터셋과 EMNIST 문자 데이터셋을 사용하였다. 먼저 MNIST 숫자 데이터셋과 EMNIST 문자 데이터셋을 이진화한 후, 부정확한 픽셀( stray pixels)을 제거하였다. 이후 하이브리드 DWT와 DCT를 이용하여 특징을 추출하였고, 분류 목적을 위해 KNN 및 SVM 분류기를 사용하였다. 제안된 방법은 SVM 분류기를 사용하여 숫자 인식에서 최고 97.74%, 문자 인식에서 최고 89.51%의 정확도를 달성하였다.