HyperAIHyperAI
منذ 2 أشهر

اكتشاف النص الموجه في الصور الطبيعية عن طريق ربط المقاطع

Shi, Baoguang ; Bai, Xiang ; Belongie, Serge
اكتشاف النص الموجه في الصور الطبيعية عن طريق ربط المقاطع
الملخص

معظم طرق الكشف عن النص المتطورة محددة للنصوص اللاتينية الأفقية وليس لديها سرعة كافية للتطبيقات في الوقت الحقيقي. نقدم طريقة الكشف عن النص الموجه Segment Linking (SegLink). الفكرة الرئيسية هي تفكيك النص إلى عناصر قابلة للكشف محليًا، وهما القطع والروابط. القطعة هي صندوق موجه يغطي جزءًا من كلمة أو سطر نص؛ الرابط يربط بين قطعتين متجاورتين، مما يشير إلى أنهما تنتميان إلى نفس الكلمة أو سطر النص. يتم اكتشاف العنصرين بكثافة على عدة مقاييس بواسطة شبكة عصبية تقنية بالكامل تم تدريبها من البداية إلى النهاية. يتم إنتاج الاكتشافات النهائية بدمج القطع المرتبطة بالروابط. مقارنة بالطرق السابقة، تحسن SegLink في أبعاد الدقة والسرعة وسهولة التدريب. حيث حققت نسبة F-measure قدرها 75.0% على معيار ICDAR 2015 Incident (تحدي 4)، مما يتفوق بشكل كبير على أفضل النتائج السابقة. تعمل بسرعة تزيد عن 20 إطارًا في الثانية على صور بحجم 512x512 بكسل. بالإضافة إلى ذلك، بدون أي تعديل، تستطيع SegLink اكتشاف السطور الطويلة من النصوص غير اللاتينية مثل الصينية.

اكتشاف النص الموجه في الصور الطبيعية عن طريق ربط المقاطع | أحدث الأوراق البحثية | HyperAI