HyperAIHyperAI
منذ 2 أشهر

حل PingAn-VCGroup لمسابقة ICDAR 2021 في مهمة تحليل الأدبيات العلمية ب: التعرف على الجداول وتحويلها إلى HTML

Jiaquan Ye; Xianbiao Qi; Yelin He; Yihao Chen; Dengyi Gu; Peng Gao; Rong Xiao
حل PingAn-VCGroup لمسابقة ICDAR 2021 في مهمة تحليل الأدبيات العلمية ب: التعرف على الجداول وتحويلها إلى HTML
الملخص

يقدم هذا البحث حلاً لمسابقة ICDAR 2021 في مهمة تحليل الأدب العلمي B: التعرف على الجداول وإعادة صياغتها إلى HTML. في طريقتنا، نقسم مهمة التعرف على محتوى الجدول إلى أربع مهام فرعية: التعرف على بنية الجدول، كشف خطوط النص، التعرف على خطوط النص، وتعيين الصناديق. يتم تخصيص خوارزمية التعرف على بنية الجدول لدينا بناءً على MASTER [1]، وهي خوارزمية قوية للتعرف على النصوص في الصور. يتم استخدام PSENet [2] لاكتشاف كل سطر نص في صورة الجدول. بالنسبة لمهمة التعرف على خطوط النص، يتم بناء نموذجنا أيضًا على MASTER. أخيرًا، في مرحلة تعيين الصناديق، ربطنا الصناديق النصية التي تم اكتشافها بواسطة PSENet بالعنصر الهيكلي الذي تم إعادة بنائه من خلال التنبؤ ببنية الجدول، وملأ المحتوى المعترف به من سطر النص في العنصر المقابل. حققت الطريقة المقترحة لدينا درجة TEDS بنسبة 96.84% على 9,115 عينة تحقق في مرحلة التطوير، ودرجة TEDS بنسبة 96.32% على 9,064 عينة في المرحلة النهائية للتقدير.

حل PingAn-VCGroup لمسابقة ICDAR 2021 في مهمة تحليل الأدبيات العلمية ب: التعرف على الجداول وتحويلها إلى HTML | أحدث الأوراق البحثية | HyperAI