HyperAIHyperAI

Command Palette

Search for a command to run...

FOTS: رصد النص الموجه بسرعة باستخدام شبكة موحدة

Xuebo Liu Ding Liang Shi Yan Dagui Chen Yu Qiao Junjie Yan

الملخص

يُعتبر اكتشاف النص العرضي من أصعب وأكثر التحديات قيمة في مجتمع تحليل الوثائق. ومعظم الطرق الحالية تتعامل مع اكتشاف النص وتعرفه كمهام منفصلة. في هذا البحث، نقترح شبكة موحدة قابلة للتدريب من النهاية إلى النهاية للكشف السريع عن النص الموجه (FOTS) لأجل الكشف والتعرف المتزامنين، مما يتيح مشاركة الحسابات والمعلومات البصرية بين المهمتين المكملتين. خصوصًا، تم تقديم RoIRotate لمشاركة الخصائص الإدراكية بين اكتشاف النص وتعرفه. بفضل استراتيجية مشاركة الإدراك، فإن FOTS لدينا يعاني من زيادة حسابية ضئيلة مقارنة بشبكة الكشف الأساسية عن النص، وطريقة التدريب المشتركة تتعلم خصائصًا أكثر عمومية مما يجعل طريقة عملنا أفضل من هذه الطرق ذات المرحلتين. تُظهر التجارب على مجموعات بيانات ICDAR 2015 وICDAR 2017 MLT وICDAR 2013 أن الطريقة المقترحة تتفوق بشكل كبير على الأساليب الرائدة في المجال، مما يسمح لنا بتطوير أول نظام للكشف عن النص الموجه في الوقت الحقيقي الذي يتفوق على جميع النتائج السابقة الرائدة بمزيدٍ يتجاوز 5% في مهمة الكشف عن النص في ICDAR 2015 بينما يحافظ على معدل إطارات بلغ 22.6 صورة في الثانية.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp