HyperAIHyperAI

Command Palette

Search for a command to run...

كشف النص الموجه في الصور الطبيعية من خلال ربط الأجزاء

Shi Baoguang Bai Xiang Belongie Serge

الملخص

تُعدّ معظم الطرق الحديثة للكشف عن النص مخصصة للنصوص الأفقية بالحروف اللاتينية، ولا تكفي السرعة المطلوبة للتطبيقات في الوقت الفعلي. نقدم في هذا العمل طريقة كشف النص الموجهة، تُدعى "ربط القطع" (SegLink). وتتمحور الفكرة الرئيسية على تفكيك النص إلى عنصرين قابلين للكشف محليًا، وهما: القطع (segments) والروابط (links). حيث يُمثل القطع صندوقًا موجهًا يغطي جزءًا من كلمة أو سطر نصي، بينما تمثل الرابطة اتصالًا بين قطعتين متجاورتين، مما يشير إلى أنهما ينتميان إلى نفس الكلمة أو السطر النصي. يتم اكتشاف هذين العنصرين بكثافة على مقياسين متعددين بواسطة شبكة عصبية تلافيفية كاملة تم تدريبها بشكل متكامل من البداية إلى النهاية. وتُنتج النتائج النهائية عن طريق دمج القطع المتصلة عبر الروابط. مقارنةً بالطرق السابقة، تُظهر طريقة SegLink تحسنًا كبيرًا من حيث الدقة، والسرعة، وسهولة التدريب. فقد حققت قياسًا مركبًا (f-measure) بلغ 75.0% على معيار ICDAR 2015 القياسي للنص العرضي (التحدي 4)، متفوقةً على أفضل نتيجة سابقة بفارق كبير. كما تعمل الطريقة بسرعة تفوق 20 إطارًا في الثانية (FPS) على صور بحجم 512×512. علاوةً على ذلك، وبلا حاجة إلى تعديل، تُظهر SegLink قدرة على كشف السطور الطويلة من النصوص غير اللاتينية، مثل النص الصيني.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp