HyperAIHyperAI
منذ 2 أشهر

TSRFormer: التعرف على هيكل الجدول باستخدام متحولات (Transformers)

Weihong Lin; Zheng Sun; Chixiang Ma; Mingze Li; Jiawei Wang; Lei Sun; Qiang Huo
TSRFormer: التعرف على هيكل الجدول باستخدام متحولات (Transformers)
الملخص

نقدم نهجًا جديدًا لتمييز هيكل الجداول (TSR)، يُطلق عليه TSRFormer، لتمييز الهياكل المعقدة للجداول ذات التشوّهات الهندسية من صور جداول متنوعة بشكل قوي. على عكس الطرق السابقة، نصوغ توقع خطوط فصل الجدول كمشكلة انحدار خطية بدلاً من مشكلة تقسيم الصور ونقترح نهجًا جديدًا متعدد المراحل يستند إلى DETR لتوقع خطوط الفصل مباشرة من صور الجداول، والذي أطلقنا عليه اسم \textbf{Sep}arator \textbf{RE}gression \textbf{TR}ansformer (SepRETR). لجعل إطار DETR متعدد المراحل يعمل بكفاءة وفعالية في مهمة توقع خطوط الفصل، نقترح تحسينين اثنين: 1) استراتيجية مطابقة معززة بالسابقات لحل مشكلة التقارب البطيء في DETR؛ 2) وحدة انتباه متقاطع جديدة لاستخراج الخصائص مباشرة من خريطة ميزات عالية الدقة باستخدام الشبكة الإدراكية التلافيفية، مما يحقق دقة تحديد موقع عالية مع تكلفة حسابية منخفضة. بعد توقع خطوط الفصل، يتم استخدام وحدة دمج الخلايا المستندة إلى شبكة العلاقات البسيطة لإعادة بناء الخلايا الممتدة. بفضل هذه التقنيات الجديدة، حقق TSRFormer أداءً رائدًا في عدة مجموعات بيانات مرجعية، بما في ذلك SciTSR وPubTabNet وWTW. بالإضافة إلى ذلك، قدّمنا أدلة على متانة نهجنا بالنسبة للجداول ذات الهياكل المعقدة والخلايا بدون حدود والمساحات البيضاء الكبيرة والخلايا الفارغة أو الممتدة وكذلك الأشكال المشوهة أو حتى المنحنية في مجموعة بيانات داخلية أكثر تحديًا تعكس العالم الحقيقي.

TSRFormer: التعرف على هيكل الجدول باستخدام متحولات (Transformers) | أحدث الأوراق البحثية | HyperAI