AKHCRNet: التعرف على الحروف اليدوية البنغالية باستخدام التعلم العميق

أقترح حلًا معماريًا متقدمًا بالشبكة العصبية العميقة لتمييز الحروف المكتوبة بخط اليد بالنسبة للحروف البنغالية، بما في ذلك الحروف المركبة والأرقام، حيث يحقق دقة قياسية تبلغ 96.8% فقط خلال 11 دورة تدريب (epochs). وقد تم إنجاز عمل مشابه سابقًا من قبل تشاترجي، سوغاتو، وآخرون، لكنهم حققوا دقة قدرها 96.12% خلال حوالي 47 دورة تدريب. أما المعمارية العصبية العميقة المستخدمة في تلك الورقة، فهي كبيرة نسبيًا نظرًا لاحتوائها على أوزان نموذج ResNet50، وهو شبكة تلافيفية ذات 50 طبقة. ويتميز النموذج المقترح بأنه يحقق دقة أعلى مقارنة بأي عمل سابق، وبعدد أقل من الدورات التدريبية. ورغم أن نموذج ResNet50 نموذج قوي تم تدريبه على مجموعة بيانات ImageNet، فإنني أقترح شبكة تمييز الحروف اليدوية (HCR) تم تدريبها من الصفر على الحروف البنغالية دون اللجوء إلى تقنية "التعلم المجمّع" (Ensemble Learning)، وتتفوق بذلك على الهياكل السابقة.