HyperAIHyperAI
منذ 11 أيام

لماذا يجب أن تجرب البيانات الحقيقية لتمييز النص في المشهد

Vladimir Loginov
لماذا يجب أن تجرب البيانات الحقيقية لتمييز النص في المشهد
الملخص

لقد دفعت الأعمال الحديثة في مجال التعرف على النصوص النتائج إلى آفاق جديدة. ولكن طوال فترة طويلة، أدى نقص المجموعات الكبيرة من البيانات الطبيعية المُعلّمة يدويًا للنص إلى إجبار الباحثين على استخدام البيانات الاصطناعية لتدريب نماذج التعرف على النصوص. وعلى الرغم من أن المجموعات الاصطناعية كبيرة جدًا (حيث تحتوي كل من مجموعتي MJSynth وSynthTest، وهما أكثر المجموعات الاصطناعية شهرة، على ملايين الصور)، إلا أن تنوعها قد يكون غير كافٍ مقارنةً بالمجموعات الطبيعية مثل ICDAR وغيرها. وfortunately، فإن التسمية الخاصة بالتعرف على النصوص التي أُطلقت مؤخرًا على مجموعة بيانات OpenImages V5 تمتلك عددًا من الأمثلة مماثلًا لعدد الأمثلة في المجموعات الاصطناعية، مع أمثلة أكثر تنوعًا. وقد استخدمنا هذه التسمية مع معمارية رأس التعرف على النصوص من نموذج Yet Another Mask Text Spotter، وحصلنا على نتائج مماثلة للنتائج القياسية (SOTA). وفي بعض المجموعات، تفوقنا حتى على النماذج السابقة التي كانت تُعدّ الأفضل في مجالها. وفي هذا البحث، نقدّم أيضًا نموذجًا جديدًا للتعرف على النصوص، وتوفر رمز النموذج (code) للجمهور.

لماذا يجب أن تجرب البيانات الحقيقية لتمييز النص في المشهد | أحدث الأوراق البحثية | HyperAI