HyperAIHyperAI

Command Palette

Search for a command to run...

A3S: تعلّم خاضع للعدوّ لتمثيلات معنوية لتحديد النصوص في المشهد

Masato Fujitake

الملخص

إن مهمة التعرف على النص في المشهد (Scene-text spotting) هي مهمة تتنبأ بمنطقة النص في الصور الطبيعية وتعترف بحروفها في نفس الوقت. وقد لاقت هذه المهمة اهتمامًا كبيرًا في السنوات الأخيرة نظرًا لتطبيقاتها الواسعة. ركزت الأبحاث الحالية بشكل رئيسي على تحسين كفاءة كشف مناطق النص، وليس التعرف على النص. وبالتالي، وعلى الرغم من تحسن دقة الكشف، إلا أن الدقة النهائية في النظام المتكامل (end-to-end) تظل غير كافية. وغالبًا ما تكون النصوص في الصور الطبيعية ليست مجرد سلسلة عشوائية من الحروف، بل سلسلة ذات معنى، أي كلمة. ولذلك، نقترح نموذج التعلم المضاد للتمثيلات المعنى في التعرف على النص في المشهد (A3S) بهدف تحسين الدقة النهائية، بما في ذلك التعرف على النص. يتنبأ نموذج A3S بشكل متزامن بسمات معنوية ضمن المنطقة المكتشفة للنص، بدلًا من الاعتماد فقط على السمات البصرية الحالية لإجراء التعرف على النص. وتشير النتائج التجريبية على مجموعات بيانات مفتوحة الوصول إلى أن الطريقة المقترحة تحقق دقة أفضل مقارنةً بالطرق الأخرى.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp