HyperAIHyperAI

Command Palette

Search for a command to run...

CascadeTabNet: نهج للكشف عن الجداول وتعرف هيكلها من الوثائق القائمة على الصور بشكل شامل

Devashish Prasad Ayan Gadpal Kshitij Kapadni Manish Visave Kavita Sultanpure

الملخص

طريقة التعرف التلقائي على الجداول لتأويل البيانات الجدولية في صور الوثائق تتضمن بشكل رئيسي حل مشكلتين هما كشف الجداول وتعرف هيكلها. العمل السابق كان يشمل حل كل من المشكلتين بشكل مستقل باستخدام نهجين منفصلين. أما الأعمال الأكثر حداثة فتؤكد استخدام حلول تعتمد على التعلم العميق مع محاولة تصميم حل شامل من البداية إلى النهاية. في هذا البحث، نقدم نهجًا محسنًا يعتمد على التعلم العميق ويكون شاملًا من البداية إلى النهاية لحل مشكلتي كشف الجداول وتعرف هيكلها باستخدام نموذج شبكة عصبية تلافيفية (CNN) واحد. نقترح CascadeTabNet: وهو نموذج يستند إلى شبكة Cascade mask Region-based CNN High-Resolution (Cascade mask R-CNN HRNet) التي تكشف المناطق التي تحتوي على جداول وتتعرف على خلايا الجسم الهيكلية من الجداول المكتشفة في الوقت نفسه. قمنا بتقييم نتائجنا على مجموعات البيانات العامة ICDAR 2013 وICDAR 2019 وTableBank. حققنا المركز الثالث في نتائج المسابقة ما بعد ICDAR 2019 لكشف الجداول بينما حصلنا على أفضل دقة للنتائج لمجموعتي بيانات ICDAR 2013 وTableBank. كما حققنا أعلى دقة للنتائج في مجموعة بيانات تعرف هيكل الجداول لـ ICDAR 2019. بالإضافة إلى ذلك، نوضح تقنيات التعلم النقل الفعالة وزيادة الصور التي تمكّن شبكات CNN من تحقيق نتائج دقيقة للغاية لكشف الجداول. تم توفير الكود ومجموعة البيانات عبر الرابط: https://github.com/DevashishPrasad/CascadeTabNet


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp