HyperAIHyperAI

Command Palette

Search for a command to run...

لماذا يجب أن تجرب البيانات الحقيقية لتمييز النص في المشهد

Vladimir Loginov

الملخص

لقد دفعت الأعمال الحديثة في مجال التعرف على النصوص النتائج إلى آفاق جديدة. ولكن طوال فترة طويلة، أدى نقص المجموعات الكبيرة من البيانات الطبيعية المُعلّمة يدويًا للنص إلى إجبار الباحثين على استخدام البيانات الاصطناعية لتدريب نماذج التعرف على النصوص. وعلى الرغم من أن المجموعات الاصطناعية كبيرة جدًا (حيث تحتوي كل من مجموعتي MJSynth وSynthTest، وهما أكثر المجموعات الاصطناعية شهرة، على ملايين الصور)، إلا أن تنوعها قد يكون غير كافٍ مقارنةً بالمجموعات الطبيعية مثل ICDAR وغيرها. وfortunately، فإن التسمية الخاصة بالتعرف على النصوص التي أُطلقت مؤخرًا على مجموعة بيانات OpenImages V5 تمتلك عددًا من الأمثلة مماثلًا لعدد الأمثلة في المجموعات الاصطناعية، مع أمثلة أكثر تنوعًا. وقد استخدمنا هذه التسمية مع معمارية رأس التعرف على النصوص من نموذج Yet Another Mask Text Spotter، وحصلنا على نتائج مماثلة للنتائج القياسية (SOTA). وفي بعض المجموعات، تفوقنا حتى على النماذج السابقة التي كانت تُعدّ الأفضل في مجالها. وفي هذا البحث، نقدّم أيضًا نموذجًا جديدًا للتعرف على النصوص، وتوفر رمز النموذج (code) للجمهور.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp