HyperAIHyperAI

Command Palette

Search for a command to run...

البيانات المصنعة لتحديد موقع النص في الصور الطبيعية

Ankush Gupta Andrea Vedaldi Andrew Zisserman

الملخص

في هذه الورقة، نقدم طريقة جديدة للكشف عن النصوص في الصور الطبيعية. تتكون هذه الطريقة من مساهمتين رئيسيتين: أولاً، محرك سريع وقابل للتوسع لإنشاء صور اصطناعية للنصوص في البيئات المعقدة. يضيف هذا المحرك النصوص الاصطناعية إلى الصور الخلفية الموجودة بطريقة طبيعية، مع مراعاة الهندسة ثلاثية الأبعاد للمشهد المحلي. ثانياً، نستخدم الصور الاصطناعية لتدريب شبكة الانحدار الكاملة القائمة على التفاف (FCRN) التي تقوم بكفاءة بعملية الكشف عن النصوص والتقدير المكاني للحدود في جميع مواقع ومقياسات الصورة. نناقش العلاقة بين شبكة FCRN والمكتشف YOLO الذي تم تقديمه مؤخراً، بالإضافة إلى أنظمة الكشف عن الأشياء الأخرى القائمة على التعلم العميق من البداية إلى النهاية. حققت الشبكة الناتجة عن هذه الطريقة تحسينًا كبيرًا مقارنة بالطرق الحالية للكشف عن النصوص في الصور الطبيعية، حيث بلغت قيمتها F-measure 84.2٪ على معيار ICDAR 2013 القياسي. علاوة على ذلك، يمكنها معالجة 15 صورة في الثانية على وحدة معالجة الرسومات (GPU).


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp