HyperAIHyperAI

Command Palette

Search for a command to run...

TRUST: نظام دقيق ومتكامل لتمييز هيكل الجداول باستخدام المتحولات القائمة على التقسيم

Zengyuan Guo Yuechen Yu Pengyuan Lv Chengquan Zhang Haojie Li Zhihui Wang Kun Yao Jingtuo Liu Jingdong Wang

الملخص

التعرف على هيكل الجدول هو جزء حاسم من مجال تحليل صور الوثائق. يكمن صعوبته في الحاجة إلى تحليل الإحداثيات المادية والمؤشرات المنطقية لكل خلية في الوقت نفسه. ومع ذلك، فإن الطرق الحالية تجد صعوبة في تحقيق هذين الهدفين، خاصة عندما تكون خطوط تقسيم الجدول غير واضحة أو مائلة. في هذا البحث، نقترح طريقة دقيقة ومتكاملة للتعرف على هيكل الجدول تعتمد على الترانسفورمرات، والتي أطلقنا عليها اسم TRUST (الثقة). تعتبر الترانسفورمرات مناسبة للتعرف على هيكل الجدول بسبب حساباتها العالمية وذاكرتها المثالية وحساباتها المتوازية. من خلال إدخال وحدة تقسيم استعلامية جديدة تعتمد على الترانسفورمرات (Transformer-based Query-based Splitting Module) ووحدة دمج تعتمد على الرؤوس (Vertex-based Merging Module)، يتم فصل مشكلة التعرف على هيكل الجدول إلى مهمتين فرعيتين مترابطتين: تقسيم الصفوف والأعمدة متعددة الاتجاهات ودمج شبكة الجدول. تقوم وحدة التقسيم الاستعلامية بتعلم المعلومات السياقية القوية من الارتباطات الطويلة عبر شبكات الترانسفورمرات، وتتنبأ بدقة بفصل الصفوف والأعمدة متعددة الاتجاهات للجدول، والحصول على الشبكات الأساسية للجدول بشكل متوافق. يمكن لوحدة الدمج التي تعتمد على الرؤوس أن تتجمع المعلومات السياقية المحلية بين الشبكات الأساسية المجاورة، مما يوفر القدرة على دمج الشبكات الأساسية التي تنتمي إلى نفس الخلية الممتدة بدقة. أجرينا تجارب على عدة مقاييس شائعة بما في ذلك PubTabNet و SynthTable، حيث حققت طryptonا نتائجًا جديدة رائدة في المجال. بشكل خاص، يعمل TRUST بمعدل 10 إطارًا في الثانية (FPS) على PubTabNet، مما يتفوق بكثير على الطرق السابقة.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
TRUST: نظام دقيق ومتكامل لتمييز هيكل الجداول باستخدام المتحولات القائمة على التقسيم | مستندات | HyperAI