التعرف على الأرقام والحروف اليدوية باستخدام DWT-DCT الهجين مع فاصل KNN وSVM
تمثّل التعرف على الأرقام والحروف المكتوبة بخط اليد أحد الموضوعات القديمة جدًا وأهمها في مجال التعرف على الأنماط. يُعد التعرف على الأرقام والحروف المكتوبة بخط اليد تحديًا مميزًا نظرًا لتنوع أساليب الكتابة، والتشابه الهيكلي بين الحروف والأرقام، بالإضافة إلى اختلاف زوايا التوجيه. ولذلك، يُعدّ إيجاد طريقة فعّالة للتعرف على هذه الأرقام والحروف وتصنيفها أمرًا بالغ الأهمية. ويُستخدم التعرف على الأرقام والحروف المكتوبة بخط اليد في تطبيقات متعددة، مثل: التعرف على لوحات الأرقام، واستخراج معلومات البطاقات التجارية، ومعالجة شيكات البنوك، ومعالجة عناوين البريد، ومعالجة جوازات السفر، ومعالجة التوقيعات، وغيرها.تُقدّم هذه الورقة طريقة جديدة للتعرف على الأرقام والحروف المكتوبة بخط اليد، تعتمد على استخلاص الميزات باستخدام تقنية مدمجة تجمع بين التحويل الموجي المنفصل (Discrete Wavelet Transform - DWT) والتحويل الكسوري المنفصل (Discrete Cosine Transform - DCT). ثم يتم إدخال الميزات المستخرجة إلى فئتي تصنيف هما: خوارزمية أقرب الجيران K-Nearest Neighbour (KNN) وآلة الدعم المتجهة (Support Vector Machine - SVM). وقد تم استخدام مجموعتي بيانات قياسيتين في التجربة: مجموعة بيانات MNIST للأرقام، ومجموعة بيانات EMNIST للحروف. في المرحلة الأولى، تم تبديل صور البيانات إلى صورة ثنائية (Binarization)، ثم تم إزالة النقاط العشوائية (stray pixels). بعد ذلك، تم استخلاص الميزات باستخدام التقنية المدمجة (DWT وDCT). وتم استخدام خوارزميتي KNN وSVM لغرض التصنيف. وقد تمكّنت الطريقة المقترحة من تحقيق أعلى دقة تصل إلى 97.74% في التعرف على الأرقام، و89.51% في التعرف على الحروف، باستخدام خوارزمية SVM.