الملخص

كشف النص في المشهد، وهو خطوة مهمة في أنظمة قراءة النصوص في المشاهد، قد شهد تطورًا سريعًا بفضل شبكات العصبونات التلافيفية. ومع ذلك، لا يزال هناك تحديان رئيسيان يعيقان تطبيقه في التطبيقات الحقيقية. أول هذه المشكلات هو التوازن بين السرعة والدقة. أما الثاني فهو نمذجة حالات النص ذات الأشكال العشوائية. مؤخرًا، تم اقتراح بعض الطرق لمعالجة كشف النص ذو الأشكال العشوائية، ولكنها نادراً ما تأخذ سرعة المراحل الكاملة للعملية بعين الاعتبار، مما قد يكون غير كافٍ في التطبيقات العملية.في هذا البحث، نقترح كاشفًا فعالًا ودقيقًا للنصوص ذات الأشكال العشوائية يُسمى شبكة تجميع البكسل (Pixel Aggregation Network - PAN)، والتي تتضمن رأس تصنيف منخفض التكلفة الحسابية ومعالجة ما بعد التعلم. وبشكل أكثر تحديدًا، يتكون الرأس التقسيمي من وحدة تعزيز الهرم المميز (Feature Pyramid Enhancement Module - FPEM) ووحدة دمج المميزات (Feature Fusion Module - FFM). تعمل FPEM كوحدة على شكل حرف U قابلة للتكرار، حيث يمكنها تقديم معلومات متعددة المستويات لتوجيه عملية التقسيم بشكل أفضل. أما FFM فهي تقوم بتجميع المميزات التي توفرها وحدات FPEM المختلفة العمق إلى مميز نهائي للتقسيم. يتم تنفيذ المعالجة ما بعد التعلم بواسطة تجميع البكسل (Pixel Aggregation - PA)، والذي يمكنه جمع بكسلات النص بدقة باستخدام متجهات الشبه المتوقعة.أظهرت التجارب على عدة مقاييس معيارية فائقة الجودة تفوق الشبكة المقترحة PAN. ومن الجدير بالذكر أن طريقتنا يمكن أن تحقق معامل F تنافسي بنسبة 79.9% بمعدل 84.2 إطار في الثانية على مجموعة بيانات CTW1500.

ملف PDF المصدر

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا

سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين

مدعوم بواسطة MailChimp

الملخص

Command Palette

شبكة تجميع البكسل للكشف عن النصوص ذات الأشكال العشوائية بفعالية ودقة

Wenhai Wang∗1, Enze Xie∗2,4, Xiaoge Song1, Yuhang Zang3, Wanjia Wang2, Tong Lu†1, Gang Yu4, and Chunhua Shen5

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

شبكة تجميع البكسل للكشف عن النصوص ذات الأشكال العشوائية بفعالية ودقة

Wenhai Wang∗1, Enze Xie∗2,4, Xiaoge Song1, Yuhang Zang3, Wanjia Wang2, Tong Lu†1, Gang Yu4, and Chunhua Shen5

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

شبكة تجميع البكسل للكشف عن النصوص ذات الأشكال العشوائية بفعالية ودقة

Wenhai Wang∗1, Enze Xie∗2,4, Xiaoge Song1, Yuhang Zang3, Wanjia Wang2, Tong Lu†1, Gang Yu4, and Chunhua Shen5

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters