اكتشاف النص الموجه في الصور الطبيعية عن طريق ربط المقاطع

معظم طرق الكشف عن النص المتطورة محددة للنصوص اللاتينية الأفقية وليس لديها سرعة كافية للتطبيقات في الوقت الحقيقي. نقدم طريقة الكشف عن النص الموجه Segment Linking (SegLink). الفكرة الرئيسية هي تفكيك النص إلى عناصر قابلة للكشف محليًا، وهما القطع والروابط. القطعة هي صندوق موجه يغطي جزءًا من كلمة أو سطر نص؛ الرابط يربط بين قطعتين متجاورتين، مما يشير إلى أنهما تنتميان إلى نفس الكلمة أو سطر النص. يتم اكتشاف العنصرين بكثافة على عدة مقاييس بواسطة شبكة عصبية تقنية بالكامل تم تدريبها من البداية إلى النهاية. يتم إنتاج الاكتشافات النهائية بدمج القطع المرتبطة بالروابط. مقارنة بالطرق السابقة، تحسن SegLink في أبعاد الدقة والسرعة وسهولة التدريب. حيث حققت نسبة F-measure قدرها 75.0% على معيار ICDAR 2015 Incident (تحدي 4)، مما يتفوق بشكل كبير على أفضل النتائج السابقة. تعمل بسرعة تزيد عن 20 إطارًا في الثانية على صور بحجم 512x512 بكسل. بالإضافة إلى ذلك، بدون أي تعديل، تستطيع SegLink اكتشاف السطور الطويلة من النصوص غير اللاتينية مثل الصينية.