HyperAIHyperAI

Command Palette

Search for a command to run...

CDeC-Net: شبكة تراكيب متحركة متسلسلة للكشف عن الجداول في صور المستندات

Madhav Agarwal Ajoy Mondal C. V. Jawahar

الملخص

تُعد عملية تحديد مواقع عناصر الصفحة أو الكائنات مثل الجداول والأشكال والمعادلات، إلخ، الخطوة الأساسية في استخراج المعلومات من صور المستندات. نقترح شبكة عميقة جديدة قابلة للتدريب من البداية إلى النهاية، تُعرف باسم (CDeC-Net)، للكشف عن الجداول الموجودة في المستندات. تتكوّن الشبكة المقترحة من توسيع متعدد المراحل لنموذج Mask R-CNN، يعتمد على هيكل مزدوج (dual backbone) يشتمل على تقوس مرن (deformable convolution)، مما يتيح كشف الجداول التي تختلف في الحجم بدقة عالية، حتى عند استخدام عتبات IoU مرتفعة. قمنا بتقييم CDeC-Net تجريبيًا على جميع مجموعات البيانات القياسية المتوفرة للجمهور – ICDAR-2013، ICDAR-2017، ICDAR-2019، UNLV، Marmot، PubLayNet، وTableBank – من خلال تجارب واسعة النطاق.تمتاز حلولنا بثلاث خصائص مهمة: (i) نموذج مُدرّب واحد، CDeC-Net‡، يُظهر أداءً متميزًا عبر جميع مجموعات البيانات القياسية الشائعة؛ (ii) نُبلغ عن أداء ممتاز على عدة عتبات لـ IoU، بما في ذلك عتبات مرتفعة؛ (iii) وباتباع نفس البروتوكول المستخدم في الدراسات الحديثة لكل مجموعة بيانات، نُظهر بشكل متسق أداءً كميًا متفوقًا. سيتم الإفصاح عن الكود والنماذج الخاصة بنا بشكل عام لتمكين إعادة إنتاج النتائج.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp