HyperAIHyperAI
منذ 2 أشهر

البيانات المصنعة لتحديد موقع النص في الصور الطبيعية

Ankush Gupta; Andrea Vedaldi; Andrew Zisserman
البيانات المصنعة لتحديد موقع النص في الصور الطبيعية
الملخص

في هذه الورقة، نقدم طريقة جديدة للكشف عن النصوص في الصور الطبيعية. تتكون هذه الطريقة من مساهمتين رئيسيتين: أولاً، محرك سريع وقابل للتوسع لإنشاء صور اصطناعية للنصوص في البيئات المعقدة. يضيف هذا المحرك النصوص الاصطناعية إلى الصور الخلفية الموجودة بطريقة طبيعية، مع مراعاة الهندسة ثلاثية الأبعاد للمشهد المحلي. ثانياً، نستخدم الصور الاصطناعية لتدريب شبكة الانحدار الكاملة القائمة على التفاف (FCRN) التي تقوم بكفاءة بعملية الكشف عن النصوص والتقدير المكاني للحدود في جميع مواقع ومقياسات الصورة. نناقش العلاقة بين شبكة FCRN والمكتشف YOLO الذي تم تقديمه مؤخراً، بالإضافة إلى أنظمة الكشف عن الأشياء الأخرى القائمة على التعلم العميق من البداية إلى النهاية. حققت الشبكة الناتجة عن هذه الطريقة تحسينًا كبيرًا مقارنة بالطرق الحالية للكشف عن النصوص في الصور الطبيعية، حيث بلغت قيمتها F-measure 84.2٪ على معيار ICDAR 2013 القياسي. علاوة على ذلك، يمكنها معالجة 15 صورة في الثانية على وحدة معالجة الرسومات (GPU).

البيانات المصنعة لتحديد موقع النص في الصور الطبيعية | أحدث الأوراق البحثية | HyperAI