HyperAIHyperAI
منذ 11 أيام

نظام تدفق يمكّن التصنيف الصفرية للجرافيمن اليدوية البنغالية

{Tashin Ahmed, Md Habibur Sifat, Linsheng Guo}
نظام تدفق يمكّن التصنيف الصفرية للجرافيمن اليدوية البنغالية
الملخص

تُجري هذه الدراسة بحثًا في التعلم بدون عينات (Zero-Shot Learning - ZSL)، وتقترح توليد صور باستخدام نموذج CycleGAN وربطًا دقيقًا للعلامات لبناء ارتباط قوي بين العلامات والرسوم الحرفية (graphemes). ويهدف البحث إلى تحسين دقة النموذج في اكتشاف الفئات غير المرئية من خلال استخدام تصنيف متقدم للصور الحرفية ومحرّك مبني على CycleGAN. تُظهر التمثيلات الناتجة للهياكل الحرفية المجردة تحسنًا ملحوظًا في التعرف، مع القدرة على التعامل مع الفئات المرئية وغير المرئية على حد سواء. وتعالج هذه الدراسة المشكلة المعقدة لاستشعار الأحرف البصرية (OCR) في السياق الخاص باللغة البنغالية. تُعرف النصوص البنغالية بتعقيدها الكبير، حيث تتكون من 49 حرفًا إجماليًا، تشمل 11 أحرفًا صوتية، و38 حرفًا متحركًا، و18 علامة تشكيل (دياكريتك). وتوفر التراكيب المركبة لهذه الحروف فرصة لتكوين ما يقارب 13,000 تباينًا فريدًا للرسوم الحرفية، وهو عدد يفوق عدد الوحدات الحرفية الموجودة في اللغة الإنجليزية. وتقدّم هذه الدراسة استراتيجية جديدة للتعلم بدون عينات في سياق OCR البنغالي. وتُركّز هذه الاستراتيجية على دمج النماذج المولّدة مع تقنيات تسمية دقيقة لتعزيز تقدّم OCR البنغالي، مع التركيز الخاص على تصنيف الرسوم الحرفية. ويسعى المشروع إلى إحداث تأثير كبير في عملية ترقيم الموارد التعليمية في شبه القارة الهندية.

نظام تدفق يمكّن التصنيف الصفرية للجرافيمن اليدوية البنغالية | أحدث الأوراق البحثية | HyperAI