HyperAIHyperAI
منذ 2 أشهر

FOTS: رصد النص الموجه بسرعة باستخدام شبكة موحدة

Xuebo Liu; Ding Liang; Shi Yan; Dagui Chen; Yu Qiao; Junjie Yan
FOTS: رصد النص الموجه بسرعة باستخدام شبكة موحدة
الملخص

يُعتبر اكتشاف النص العرضي من أصعب وأكثر التحديات قيمة في مجتمع تحليل الوثائق. ومعظم الطرق الحالية تتعامل مع اكتشاف النص وتعرفه كمهام منفصلة. في هذا البحث، نقترح شبكة موحدة قابلة للتدريب من النهاية إلى النهاية للكشف السريع عن النص الموجه (FOTS) لأجل الكشف والتعرف المتزامنين، مما يتيح مشاركة الحسابات والمعلومات البصرية بين المهمتين المكملتين. خصوصًا، تم تقديم RoIRotate لمشاركة الخصائص الإدراكية بين اكتشاف النص وتعرفه. بفضل استراتيجية مشاركة الإدراك، فإن FOTS لدينا يعاني من زيادة حسابية ضئيلة مقارنة بشبكة الكشف الأساسية عن النص، وطريقة التدريب المشتركة تتعلم خصائصًا أكثر عمومية مما يجعل طريقة عملنا أفضل من هذه الطرق ذات المرحلتين. تُظهر التجارب على مجموعات بيانات ICDAR 2015 وICDAR 2017 MLT وICDAR 2013 أن الطريقة المقترحة تتفوق بشكل كبير على الأساليب الرائدة في المجال، مما يسمح لنا بتطوير أول نظام للكشف عن النص الموجه في الوقت الحقيقي الذي يتفوق على جميع النتائج السابقة الرائدة بمزيدٍ يتجاوز 5% في مهمة الكشف عن النص في ICDAR 2015 بينما يحافظ على معدل إطارات بلغ 22.6 صورة في الثانية.

FOTS: رصد النص الموجه بسرعة باستخدام شبكة موحدة | أحدث الأوراق البحثية | HyperAI