HyperAIHyperAI

Command Palette

Search for a command to run...

منذ 4 أشهر

ستار-نيت: شبكة انتباه مكانيّة مُتبقّية للتعرف على النص في المشهد.

{and J. Han. K.-Y. K. Wong W. Liu Z. Su C. Chen}

الملخص

في هذه الورقة، نقدم شبكةً جديدةً تُدعى STAR-Net (شبكة الانتباه المكاني المُعادِل) لتمييز النصوص في المشاهد. تم تجهيز STAR-Net بآلية انتباه مكانيّة تستخدم محولًا مكانيًّا لإزالة التشوهات التي تظهر في النصوص ضمن الصور الطبيعية. هذا يسمح للمُستخرج المُميزات التالي بالتركيز على المنطقة المُستقيمة للنص دون أن يشتت انتباهه بسبب التشوهات. كما تستفيد STAR-Net من كتل التبديل التلافيفي (residue convolutional blocks) لبناء مستخرج مميزات عميق جدًا، وهو أمر بالغ الأهمية لاستخلاص مميزات نصية تمييزية بنجاح في هذه المهمة الدقيقة التمييز. وبدمج آلية الانتباه المكاني مع كتل التبديل التلافيفي، تُعد STAR-Net أعمق شبكة عصبية قابلة للتدريب من البداية إلى النهاية لتمييز النصوص في المشاهد. تم إجراء تجارب على خمسة مجموعات بيانات معيارية عامة. أظهرت النتائج التجريبية أن STAR-Net يمكنها تحقيق أداءً يُقارن بأفضل الطرق الحالية في تمييز النصوص ذات التشوهات البسيطة، كما تتفوّق على هذه الطرق في حالة النصوص ذات التشوهات الكبيرة.

المعايير القياسية

معيار قياسيالمنهجيةالمقاييس
scene-text-recognition-on-icdar-2003STAR-Net
Accuracy: 89.9
scene-text-recognition-on-icdar2013STAR-Net
Accuracy: 89.1
scene-text-recognition-on-svtSTAR-Net
Accuracy: 83.6

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة المشتركة بالذكاء الاصطناعي
وحدات معالجة رسومات جاهزة
أفضل الأسعار
ابدأ الآن

Hyper Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
ستار-نيت: شبكة انتباه مكانيّة مُتبقّية للتعرف على النص في المشهد. | الأوراق البحثية | HyperAI