Command Palette
Search for a command to run...
كشف النص الموجه في الصور الطبيعية من خلال ربط الأجزاء
كشف النص الموجه في الصور الطبيعية من خلال ربط الأجزاء
Shi Baoguang Bai Xiang Belongie Serge
الملخص
تُعدّ معظم الطرق الحديثة للكشف عن النص مخصصة للنصوص الأفقية بالحروف اللاتينية، ولا تكفي السرعة المطلوبة للتطبيقات في الوقت الفعلي. نقدم في هذا العمل طريقة كشف النص الموجهة، تُدعى "ربط القطع" (SegLink). وتتمحور الفكرة الرئيسية على تفكيك النص إلى عنصرين قابلين للكشف محليًا، وهما: القطع (segments) والروابط (links). حيث يُمثل القطع صندوقًا موجهًا يغطي جزءًا من كلمة أو سطر نصي، بينما تمثل الرابطة اتصالًا بين قطعتين متجاورتين، مما يشير إلى أنهما ينتميان إلى نفس الكلمة أو السطر النصي. يتم اكتشاف هذين العنصرين بكثافة على مقياسين متعددين بواسطة شبكة عصبية تلافيفية كاملة تم تدريبها بشكل متكامل من البداية إلى النهاية. وتُنتج النتائج النهائية عن طريق دمج القطع المتصلة عبر الروابط. مقارنةً بالطرق السابقة، تُظهر طريقة SegLink تحسنًا كبيرًا من حيث الدقة، والسرعة، وسهولة التدريب. فقد حققت قياسًا مركبًا (f-measure) بلغ 75.0% على معيار ICDAR 2015 القياسي للنص العرضي (التحدي 4)، متفوقةً على أفضل نتيجة سابقة بفارق كبير. كما تعمل الطريقة بسرعة تفوق 20 إطارًا في الثانية (FPS) على صور بحجم 512×512. علاوةً على ذلك، وبلا حاجة إلى تعديل، تُظهر SegLink قدرة على كشف السطور الطويلة من النصوص غير اللاتينية، مثل النص الصيني.