HyperAIHyperAI

Command Palette

Search for a command to run...

كشف النص في المشهد متعدد الاتجاهات من خلال تحديد الزوايا والتقسيم الإقليمي

Lyu Pengyuan Yao Cong Wu Wenhao Yan Shuicheng Bai Xiang

الملخص

يمكن تصنيف الطرق المتطورة حديثًا القائمة على التعلم العميق للكشف عن النصوص في المشاهد إلى فئتين رئيسيتين. تُعامل الفئة الأولى النصوص في المشاهد كنوع من الكائنات العامة، وتتبع منهجية الكشف عن الكائنات العامة لتحديد مواقع النصوص من خلال الانحدار في مواقع مربعات النص، لكنها تواجه صعوبات بسبب الاتجاهات العشوائية وأطوال النسب الطولية الكبيرة للنصوص في المشاهد. أما الفئة الثانية، فهي تقوم بفصل مناطق النص مباشرة، لكنها غالبًا ما تتطلب معالجة ما بعدية معقدة. في هذا البحث، نقدم طريقة تجمع بين أفكار النوعين مع تجنب عيوبهما. نقترح الكشف عن النصوص في المشاهد من خلال تحديد نقاط الزوايا لمربعات حدود النص، وتقسيم مناطق النص وفقًا لمواقعها النسبية. وفي مرحلة الاستدلال، تُولَّد صناديق مرشحة من خلال عينة وتوحيد نقاط الزوايا، ثم تُقدَّم نقاط تقييم لها باستخدام خرائط التقسيم، وتُقلَّل بأسلوب القمع المتبقي (NMS). مقارنةً بالطرق السابقة، تُمكن هذه الطريقة من التعامل مع النصوص الطويلة المائلة بشكل طبيعي، ولا تتطلب معالجة ما بعدية معقدة. وقد أظهرت التجارب على مجموعات ICDAR2013 وICDAR2015 وMSRA-TD500 وMLT وCOCO-Text أن الخوارزمية المقترحة تحقق نتائج أفضل أو مماثلة من حيث الدقة والكفاءة. وباستخدام المعمارية VGG16، حققت قياسًا محسوبًا (F-measure) بلغ 84.3% على ICDAR2015 و81.5% على MSRA-TD500.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
كشف النص في المشهد متعدد الاتجاهات من خلال تحديد الزوايا والتقسيم الإقليمي | مستندات | HyperAI