HyperAIHyperAI

Command Palette

Search for a command to run...

ABCNet: الكشف الفوري عن النص في المشهد باستخدام شبكة منحنى بيزير المتكيفة

Yuliang Liu Hao Chen Chunhua Shen Tong He Lianwen Jin Liangwei Wang

الملخص

تمت ملاحظة اهتمام متزايد بالبحث في كشف وتحديد النصوص في المشاهد. يمكن تقسيم الطرق الحالية إلى مجموعتين رئيسيتين: الطرق القائمة على الحروف (character-based) والطرق القائمة على التجزئة (segmentation-based). وتتميز هذه الطرق إما بتكاليف مرتفعة في تسمية الحروف، أو باحتياجها إلى خطوات معقدة في النظام (pipeline)، مما يجعلها غير مناسبة غالبًا للتطبيقات الزمنية الحقيقية. ولحل هذه المشكلة، نقترح شبكة منحنى بيزير المُعدّلة (Adaptive Bezier-Curve Network - ABCNet). وتمتاز مساهماتنا بثلاثة جوانب رئيسية: 1) لأول مرة، نُطبّق منحنى بيزير مُعدّل مُعاملًا لتناسب النصوص ذات الأشكال العشوائية. 2) نصمم طبقة جديدة تُسمى BezierAlign لاستخراج ميزات تلافيفية دقيقة لInstances النصوص ذات الأشكال العشوائية، مما يُحسّن بشكل ملحوظ من الدقة مقارنة بالطرق السابقة. 3) مقارنةً بالكشف عن المربعات المحيطة القياسية، يُدخل كشف منحنى بيزير تكلفة حسابية ضئيلة جدًا، مما يمنح طريقة ABCNet ميزة واضحة من حيث الكفاءة والدقة معًا. وقد أظهرت التجارب على مجموعات بيانات معيارية ذات أشكال نصوص عشوائية، مثل Total-Text وCTW1500، أن ABCNet تحقق أداءً متقدمًا على مستوى الحالة الحالية (state-of-the-art) من حيث الدقة، مع تحسين ملحوظ في السرعة. وبشكل خاص، على مجموعة Total-Text، فإن النسخة الزمنية الحقيقية (realtime) من ABCNet أسرع بأكثر من 10 أضعاف مقارنة بالطرق المتقدمة الحديثة، مع الحفاظ على دقة تنافسية في التعرف. يمكن الاطلاع على الكود عبر الرابط: https://tinyurl.com/AdelaiDet


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp