HyperAIHyperAI
منذ 2 أشهر

TRUST: نظام دقيق ومتكامل لتمييز هيكل الجداول باستخدام المتحولات القائمة على التقسيم

Zengyuan Guo; Yuechen Yu; Pengyuan Lv; Chengquan Zhang; Haojie Li; Zhihui Wang; Kun Yao; Jingtuo Liu; Jingdong Wang
TRUST: نظام دقيق ومتكامل لتمييز هيكل الجداول باستخدام المتحولات القائمة على التقسيم
الملخص

التعرف على هيكل الجدول هو جزء حاسم من مجال تحليل صور الوثائق. يكمن صعوبته في الحاجة إلى تحليل الإحداثيات المادية والمؤشرات المنطقية لكل خلية في الوقت نفسه. ومع ذلك، فإن الطرق الحالية تجد صعوبة في تحقيق هذين الهدفين، خاصة عندما تكون خطوط تقسيم الجدول غير واضحة أو مائلة. في هذا البحث، نقترح طريقة دقيقة ومتكاملة للتعرف على هيكل الجدول تعتمد على الترانسفورمرات، والتي أطلقنا عليها اسم TRUST (الثقة). تعتبر الترانسفورمرات مناسبة للتعرف على هيكل الجدول بسبب حساباتها العالمية وذاكرتها المثالية وحساباتها المتوازية. من خلال إدخال وحدة تقسيم استعلامية جديدة تعتمد على الترانسفورمرات (Transformer-based Query-based Splitting Module) ووحدة دمج تعتمد على الرؤوس (Vertex-based Merging Module)، يتم فصل مشكلة التعرف على هيكل الجدول إلى مهمتين فرعيتين مترابطتين: تقسيم الصفوف والأعمدة متعددة الاتجاهات ودمج شبكة الجدول. تقوم وحدة التقسيم الاستعلامية بتعلم المعلومات السياقية القوية من الارتباطات الطويلة عبر شبكات الترانسفورمرات، وتتنبأ بدقة بفصل الصفوف والأعمدة متعددة الاتجاهات للجدول، والحصول على الشبكات الأساسية للجدول بشكل متوافق. يمكن لوحدة الدمج التي تعتمد على الرؤوس أن تتجمع المعلومات السياقية المحلية بين الشبكات الأساسية المجاورة، مما يوفر القدرة على دمج الشبكات الأساسية التي تنتمي إلى نفس الخلية الممتدة بدقة. أجرينا تجارب على عدة مقاييس شائعة بما في ذلك PubTabNet و SynthTable، حيث حققت طryptonا نتائجًا جديدة رائدة في المجال. بشكل خاص، يعمل TRUST بمعدل 10 إطارًا في الثانية (FPS) على PubTabNet، مما يتفوق بكثير على الطرق السابقة.

TRUST: نظام دقيق ومتكامل لتمييز هيكل الجداول باستخدام المتحولات القائمة على التقسيم | أحدث الأوراق البحثية | HyperAI