BN-HTRd: مجموعة بيانات مرجعية للاعتراف بالنصوص اليدوية البنغالية غير المتصلة بالشبكة وتقسيم السطور على مستوى المستند

نقدم مجموعة بيانات جديدة للاعتراف بالنصوص المكتوبة بخط اليد (HTR) من صور النصوص البангالية التي تتضمن كلمات وسطور وشروحات مستندية. تعتمد مجموعة البيانات BN-HTRd على مجمع نصوص أخبار بي بي سي البانغالية، والتي تهدف إلى أن تكون النصوص الحقيقية. تم استخدام هذه النصوص بعد ذلك لإنشاء الشروحات التي قام الأشخاص بتعبئتها بخط يدهم. تشمل مجموعتنا من البيانات 788 صورة لصفحات مكتوبة بخط اليد بواسطة حوالي 150 كاتبًا مختلفًا. يمكن اعتمادها كأساس لمهام تصنيف الخط المختلفة مثل الاعتراف المستندية من البداية إلى النهاية، وكشف الكلمات، وتقسيم الكلمات أو السطور وما إلى ذلك.كما نقترح طريقة لتقسيم صور المستندات المكتوبة بخط اليد البانغالي إلى السطور المقابلة بطريقة غير مراقبة. تأخذ طريقة تقسيمنا السطور في الاعتبار التباين الموجود في أساليب الكتابة المختلفة، مما يتيح تقسيم سطور النصوص المكتوبة بخط اليد بشكل دقيق حتى وإن كانت معقدة ومقوسة. بالإضافة إلى حزمة من العمليات الأولية والتشوهية، تم استخدام تحويل خطوط هوف وتحويل الدوائر هوف لكلاهما لتمييز المكونات الخطية المختلفة. ولترتيب هذه المكونات في سطورها المقابلة، اتبعنا نهج تجميع غير مراقب. معدل النجاح المتوسط لتقنية التقسيم الخاصة بنا هو 81.57٪ حسب مقاييس FM (مشابهة لمقاييس F) بمتوسط دقة (mAP) قدره 0.547.