مسابقة ICDAR 2024 المتعلقة بالتقطيع التخطيطي للنصوص القديمة بعينات قليلة وعديدة (SAM)
تحليل التخطيط يُعد جزءًا حاسمًا في تحليل صور المستندات، خصوصًا عند التعامل مع المخطوطات القديمة. يُشكّل هذا التحليل الخطوة الأساسية في تبسيط المهام اللاحقة مثل التعرف البصري على النصوص والكتابة التلقائية. ومع ذلك، يمثل أحد التحديات الأساسية في هذا السياق نقص البيانات الحقيقية (ground truths)، نظرًا لكون إنشاء هذه البيانات يتطلب وقتًا طويلاً جدًا. ورغم ذلك، تعتمد العديد من النماذج المعتمدة لمعالجة هذا التحدي بشكل كبير على منهجية التعلم الخاضع للإشراف الكامل، وهي حالة نادرة في البيئات الواقعية. ولذلك، نقترح في هذا المسابقة التحدي المتمثل في معالجة هذه المهمة باستخدام نموذج تعلم قائم على عدد قليل من الأمثلة (few-shot learning)، مع استخدام ثلاث صور فقط للتدريب. يتضمن مجموعة بيانات المسابقة، المُسمّاة U-DIADS-Bib، أربعة مخطوطات قديمة مختلفة، وتتميز ببنية تخطيطية متنوعة، ومستويات مختلفة من التدهور، واللغات المستخدمة. وتضيف هذه التنوّع جاذبية وتعقيدًا كبيرين للتحدي. علاوةً على ذلك، سمحنا للمشاركين بالمشاركة باستخدام النماذج التقليدية التي تعتمد على التعلم من عدد كبير من الأمثلة (many-shot learning)، حيث تم توفير مجموعة التدريب الكاملة لبيانات U-DIADS-Bib.