HyperAIHyperAI
منذ 2 أشهر

EAST: كاشف نصوص المشهد الفعّال والدقيق

Zhou, Xinyu ; Yao, Cong ; Wen, He ; Wang, Yuzhi ; Zhou, Shuchang ; He, Weiran ; Liang, Jiajun
EAST: كاشف نصوص المشهد الفعّال والدقيق
الملخص

الطرق السابقة لاكتشاف النص في المشاهد قد حققت أداءً واعداً عبر مختلف المعايير. ومع ذلك، فإنها عادة ما تفشل عند التعامل مع السيناريوهات الصعبة، حتى عند تجهيزها بـ نماذج الشبكات العصبية العميقة، لأن الأداء الكلي يتحدد من خلال التفاعل بين مراحل متعددة ومكونات في خطوط العمل. في هذا البحث، نقترح خط عمل بسيط ولكنه قوي ينتج اكتشافًا سريعًا ودقيقًا للنص في المشاهد الطبيعية. يقوم هذا الخط مباشرة بتوقع الكلمات أو سطور النص ذات الاتجاهات والأشكال الرباعية العشوائية في الصور الكاملة، مما يلغي الخطوات الوسيطة غير الضرورية (مثل تجميع المرشحين وتقسيم الكلمات) باستخدام شبكة عصبية واحدة. تتيح البساطة في خطتنا التركيز على تصميم دوال الخسارة والهندسة المعمارية للشبكة العصبية.التجارب التي أجريت على مجموعات بيانات قياسية مثل ICDAR 2015 و COCO-Text و MSRA-TD500 أظهرت أن الخوارزمية المقترحة تتفوق بشكل كبير على أفضل الأساليب الحالية من حيث الدقة والكفاءة. وعلى مجموعة بيانات ICDAR 2015، حققت الخوارزمية المقترحة درجة F مقدارها 0.7820 بمعدل 13.2 صورة في الثانية عند دقة 720p.