HyperAIHyperAI
منذ 2 أشهر

اكتشاف النص في المشهد الشامل باستخدام تجزئة الصندوق بدون تسلسل

Yuliang Liu; Sheng Zhang; Lianwen Jin; Lele Xie; Yaqiang Wu; Zhepeng Wang
اكتشاف النص في المشهد الشامل باستخدام تجزئة الصندوق بدون تسلسل
الملخص

النص في المشاهد الطبيعية يتم تقديمه عادةً بخصائص متنوعة بشكل كبير. استخدام الصندوق الحدودي الرباعي لتحديد موقع النص هو تقريبًا ضروري للطرق الكشفية. ومع ذلك، كشفت الأبحاث الحديثة أن إدخال الصندوق الحدودي الرباعي للكشف عن النص في المشاهد قد يجلب مشكلة ارتباك التسمية التي يمكن تجاهلها بسهولة، وهذه المشكلة قد تؤثر بشكل كبير على أداء الكشف. لحل هذه المشكلة، نقترح في هذا البحث طريقة جديدة تُعرف باسم التجزئة الخالية من التتابع للصندوق الحدودي (Sequential-free Box Discretization - SBD) من خلال تجزئة الصندوق الحدودي إلى حواف رئيسية (KE) والتي يمكن أن تستنتج منها طرق أكثر فعالية لتحسين أداء الكشف. أظهرت التجارب أن الطريقة المقترحة يمكن أن تتفوق على أفضل الطرق المعروفة في العديد من مقاييس الكشف عن النص الشائع مثل ICDAR 2015 و MLT و MSRA-TD500. كما أظهرت دراسة الاستبعاد (Ablation study) أن دمج SBD ببساطة في إطار Mask R-CNN يمكن أن يحسن بشكل كبير من أداء الكشف. بالإضافة إلى ذلك، تم إجراء تجربة على مجموعة بيانات الأشياء العامة HRSC2016 (السفن متعددة الاتجاهات) أظهرت أن طريقتنا يمكن أن تتفوق على أفضل الطرق الحديثة بمقدار كبير، مما يدل على قدرتها القوية على التعميم. شفرة المصدر: https://github.com/Yuliang-Liu/Box_Discretization_Network.

اكتشاف النص في المشهد الشامل باستخدام تجزئة الصندوق بدون تسلسل | أحدث الأوراق البحثية | HyperAI