HyperAIHyperAI
منذ 2 أشهر

الكشف القوي عن الجداول وتعرف هيكلها من صور الوثائق المتنوعة

Chixiang Ma; Weihong Lin; Lei Sun; Qiang Huo
الكشف القوي عن الجداول وتعرف هيكلها من صور الوثائق المتنوعة
الملخص

نقدم نهجًا جديدًا للكشف عن الجداول وتمييز هياكلها باسم RobusTabNet لاكتشاف حدود الجداول وإعادة بناء الهيكل الخلوي لكل جدول من صور المستندات المتنوعة. فيما يتعلق بكشف الجداول، نقترح استخدام CornerNet كشبكة اقتراح منطقة جديدة لتوليد مقترحات جدول ذات جودة أعلى لـ Faster R-CNN، مما أدى إلى تحسين كبير في دقة التحديد الخاصة بـ Faster R-CNN لكشف الجداول. نتيجة لذلك، يحقق نهجنا لكشف الجداول أداءً رائدًا على ثلاثة معايير عامة لكشف الجداول، وهي cTDaR TrackA وPubLayNet وIIIT-AR-13K، باستخدام شبكة ResNet-18 الخفيفة الوزن فقط.بالإضافة إلى ذلك، نقترح نهجًا جديدًا لتمييز هيكل الجدول يستند إلى التقسيم والدمج، حيث تم اقتراح وحدة تنبؤ خط الفصل المستندة إلى الشبكة العصبية المكانية (Spatial CNN) لتقسيم كل جدول مكتشف إلى شبكة من الخلايا، ويتم تطبيق وحدة دمج الخلايا المستندة إلى الشبكة العصبية الشبكية (Grid CNN) لإعادة استرداد الخلايا الممتدة. نظرًا لقدرة وحدة الشبكة العصبية المكانية على نشر المعلومات السياقية بشكل فعال عبر صورة الجدول بأكملها، يمكن لجهاز تمييز هيكل الجدول الخاص بنا التعرف على الجداول التي تحتوي على فراغات كبيرة وتكون مشوهة هندسيًا (حتى المنحنية) بشكل متين.شكراً لهذه التقنيتين، يحقق نهجنا لتمييز هيكل الجدول أداءً رائدًا على ثلاثة معايير عامة تشمل SciTSR وPubTabNet وcTDaR TrackB2-Modern. علاوة على ذلك، قدمنا أدلة إضافية على مزايا نهجنا في التعرف على الجداول ذات الهياكل المعقدة والفراغات الكبيرة وكذلك الأشكال المشوهة هندسيًا أو حتى المنحنية في مجموعة بيانات داخلية أكثر تحديًا.

الكشف القوي عن الجداول وتعرف هيكلها من صور الوثائق المتنوعة | أحدث الأوراق البحثية | HyperAI