HyperAIHyperAI
منذ 11 أيام

CDeC-Net: شبكة تراكيب متحركة متسلسلة للكشف عن الجداول في صور المستندات

Madhav Agarwal, Ajoy Mondal, C. V. Jawahar
CDeC-Net: شبكة تراكيب متحركة متسلسلة للكشف عن الجداول في صور المستندات
الملخص

تُعد عملية تحديد مواقع عناصر الصفحة أو الكائنات مثل الجداول والأشكال والمعادلات، إلخ، الخطوة الأساسية في استخراج المعلومات من صور المستندات. نقترح شبكة عميقة جديدة قابلة للتدريب من البداية إلى النهاية، تُعرف باسم (CDeC-Net)، للكشف عن الجداول الموجودة في المستندات. تتكوّن الشبكة المقترحة من توسيع متعدد المراحل لنموذج Mask R-CNN، يعتمد على هيكل مزدوج (dual backbone) يشتمل على تقوس مرن (deformable convolution)، مما يتيح كشف الجداول التي تختلف في الحجم بدقة عالية، حتى عند استخدام عتبات IoU مرتفعة. قمنا بتقييم CDeC-Net تجريبيًا على جميع مجموعات البيانات القياسية المتوفرة للجمهور – ICDAR-2013، ICDAR-2017، ICDAR-2019، UNLV، Marmot، PubLayNet، وTableBank – من خلال تجارب واسعة النطاق.تمتاز حلولنا بثلاث خصائص مهمة: (i) نموذج مُدرّب واحد، CDeC-Net‡، يُظهر أداءً متميزًا عبر جميع مجموعات البيانات القياسية الشائعة؛ (ii) نُبلغ عن أداء ممتاز على عدة عتبات لـ IoU، بما في ذلك عتبات مرتفعة؛ (iii) وباتباع نفس البروتوكول المستخدم في الدراسات الحديثة لكل مجموعة بيانات، نُظهر بشكل متسق أداءً كميًا متفوقًا. سيتم الإفصاح عن الكود والنماذج الخاصة بنا بشكل عام لتمكين إعادة إنتاج النتائج.

CDeC-Net: شبكة تراكيب متحركة متسلسلة للكشف عن الجداول في صور المستندات | أحدث الأوراق البحثية | HyperAI