HyperAIHyperAI

Command Palette

Search for a command to run...

كشف الجداول في البيئة البرية: مجموعة بيانات جديدة ومتنوعة لكشف الجداول وطريقة جديدة

Mrinal Haloi Shashank Shekhar Nikhil Fande Siddhant Swaroop Dash Sanjay G

الملخص

أحرزت النماذج الحديثة القائمة على التعلم العميق في كشف الجداول تقدماً ملحوظاً وأثبتت فعاليتها في تحديد تخطيط المستندات. ومع ذلك، تواجه المعايير الحالية للكشف عن الجداول العديد من القيود، بما في ذلك قلة تنوع العينات، وبساطة هيكل الجداول، ونقص حالات التدريب، وانخفاض جودة العينات. في هذه الورقة، نقدم مجموعة بيانات واسعة النطاق ومتنوعة للكشف عن الجداول، تضم أكثر من سبعة آلاف عينة تحتوي على تنوع كبير في هياكل الجداول، تم جمعها من مصادر متعددة ومتنوعة. بالإضافة إلى ذلك، نقدّم نتائج أساسية باستخدام منهجية تعتمد على الشبكات العصبية التلافيفية (CNN) للكشف عن هيكل الجداول في المستندات. أظهرت النتائج التجريبية تفوق الطرق القائمة على التعلم العميق التلافيفي مقارنة بالطرق التقليدية المستندة إلى الرؤية الحاسوبية. وسيمكّن إدخال هذه المجموعة المتنوعة من بيانات الكشف عن الجداول المجتمع من تطوير طرق تعلم عميق عالية الإنتاجية لفهم تخطيط المستندات ومعالجة البيانات الجدولية. يمكن الوصول إلى مجموعة البيانات من خلال الروابط التالية:1. https://www.kaggle.com/datasets/mrinalim/stdw-dataset2. https://huggingface.co/datasets/n3011/STDW


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp