HyperAIHyperAI
منذ 17 أيام

التفكيك الدقيق للبكسل في تخطيط المستندات عبر أمثلة قليلة باستخدام توليد المثيلات الديناميكية والحد الأقصى المحلي

{Gian Luca Foresti, Emanuela Colombi, Claudio Piciarelli, Silvia Zottin, Axel De Nardin}
الملخص

على مر السنين، طلبت مجتمعات العلوم الإنسانية بشكل متزايد إنشاء أطر ذكاء اصطناعي لمساعدة دراسة التراث الثقافي. وتشكل تقسيم تخطيط المستندات، الذي يهدف إلى تحديد المكونات البنائية المختلفة لصفحة المستند، مهمة مثيرة للاهتمام مرتبطة بهذه الاتجاه، وخاصةً عند التعامل مع النصوص المكتوبة بخط اليد. وعلى الرغم من وجود العديد من النُهج الفعالة لحل هذه المشكلة، فإن جميعها تعتمد على كميات كبيرة من البيانات لتدريب النماذج الكامنة وراءها، وهو ما يكون نادرًا في السياقات الواقعية، نظرًا لأن عملية إنشاء تقسيم "الحقيقة الأساسية" (ground truth) بمستوى دقة يمتد إلى مستوى البكسلات تُعد مهمة طويلة الأمد، وغالبًا ما تتطلب مستوى معين من المعرفة المتخصصة بخصوص المستندات المعنية. ولذلك، في هذه الورقة البحثية، نقترح إطارًا فعّالًا للتعلم القليل (few-shot learning) لتقسيم تخطيط المستندات، يعتمد على مكوّنين جديدين هما: توليد ديناميكي للInstances (الكائنات الفردية)، ووحدة تحسين للتقسيم. ويُظهر هذا النهج أداءً مماثلًا لأفضل النماذج الحالية على مجموعة بيانات Diva-HisDB الشهيرة، مع الاعتماد فقط على جزء ضئيل من البيانات المتاحة.