HyperAIHyperAI
منذ 2 أشهر

التعرف على الحروف المكتوبة بخط اليد باستخدام مجموعات بيانات صغيرة جداً

Vinoj Jayasundara; Sandaru Jayasekara; Hirunima Jayasekara; Jathushan Rajasegaran; Suranga Seneviratne; Ranga Rodrigo
التعرف على الحروف المكتوبة بخط اليد باستخدام مجموعات بيانات صغيرة جداً
الملخص

تواجه العديد من اللغات المحلية صعوبات في الاستفادة من التطورات الحديثة في أنظمة التعرف على الحروف بسبب نقص كمية كبيرة من البيانات التدريبية المصنفة. هذا يرجع إلى صعوبة إنتاج كميات كبيرة من البيانات المصنفة لهذه اللغات وعدم قدرة تقنيات التعلم العميق على التعلم بشكل صحيح من عدد قليل من عينات التدريب. نحن نحل هذه المشكلة من خلال تقديم تقنية لإنشاء عينات تدريبية جديدة من العينات الموجودة، مع تعديلات واقعية تعكس الاختلافات الفعلية الموجودة في الكتابة اليدوية البشرية، وذلك بإضافة ضوضاء متحكم فيها بشكل عشوائي إلى معلماتها المرتبطة. نتائجنا باستخدام 200 عينة تدريب فقط لكل فئة تتفوق على النتائج الحالية للتعرف على الحروف في مجموعة بيانات EMNIST-letter بينما تحقق النتائج الحالية في ثلاث مجموعات بيانات: EMNIST-balanced، EMNIST-digits، وMNIST. كما طورنا استراتيجية لاستخدام مزيج فعال من دوال الخسارة لتحسين إعادة الإعمار. نظامنا مفيد في التعرف على الحروف للغات المحلية التي تعاني من نقص كبير في البيانات التدريبية المصنفة وحتى في سياقات أكثر عمومية ذات صلة مثل التعرف على الأشياء.