HyperAIHyperAI

Command Palette

Search for a command to run...

الانحدار الحساس للدوران للكشف عن النص المشهد الموجه

Minghui Liao; Zhen Zhu; Baoguang Shi; Gui-song Xia; Xiang Bai

الملخص

النص في الصور الطبيعية يكون باتجاهات عشوائية، مما يتطلب اكتشافه من خلال مربعات الحدود الموجهة. عادةً، يشمل الكاشف المتعدد الاتجاهات للنصوص مهامين أساسيتين: 1) اكتشاف وجود النص، وهو مشكلة تصنيف لا تأخذ في الاعتبار اتجاه النص؛ 2) الانحدار لمربع الحدود الموجهة، والذي يهتم باتجاه النص. تعاني الأساليب السابقة من أداء متدهور بسبب عدم توافق هذين المهمتين عند الاعتماد على الخصائص المشتركة. لحل هذه المشكلة، نقترح إجراء التصنيف والانحدار على خصائص مختلفة مستخرجة بواسطة فرعين مختلفي التصميم في الشبكة العصبية. بالتحديد، يقوم الفرع المسؤول عن الانحدار باستخراج الخصائص الحساسة للدوران من خلال تدوير مرشحات التحويل بشكل نشط، بينما يستخرج الفرع المسؤول عن التصنيف الخصائص غير الحساسة للدوران من خلال جمع الخصائص الحساسة للدوران. الطريقة المقترحة التي تم تسميتها بكاشف الانحدار الحساس للدوران (RRD) تحقق أفضل الأداء على ثلاثة مجموعات بيانات مرجعية للنصوص المشهدية الموجهة، بما في ذلك ICDAR 2015 و MSRA-TD500 و RCTW-17 و COCO-Text. بالإضافة إلى ذلك، حقق RRD تحسيناً كبيراً على مجموعة بيانات لمجموعة سفن، مما يدل على قدرته العامة في اكتشاف الأشياء الموجهة.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp