HyperAIHyperAI

Command Palette

Search for a command to run...

التدريب الذاتي للتنقيط من حرف إلى حرف للاعتراف بالنص

Tongkun Guan extsuperscript1 Wei Shen extsuperscript1 extsuperscript* Xue Yang extsuperscript1 Qi Feng extsuperscript2 Zekun Jiang extsuperscript1 Xiaokang Yang extsuperscript1

الملخص

عند التعامل مع صور النصوص المعقدة (مثل الهياكل غير المنتظمة، الدقة المنخفضة، التغطية الكثيفة، والإضاءة غير المتساوية)، تكون طرق التعرف على النصوص المراقبة الحالية متعطشة للبيانات. رغم أن هذه الطرق تستخدم صور نصوص مصنعة على نطاق واسع لتقليل الاعتماد على الصور الحقيقية المشمولة بالتعليقات، فإن الفجوة بين المجالات لا تزال تحد من أداء التعرف. لذلك، استكشاف تمثيلات الخصائص النصية القوية في الصور الحقيقية غير المشمولة بالتعليقات عبر التعلم الذاتي هو حل جيد. ومع ذلك، فإن طرق التعرف على النصوص ذاتية الرقابة الحالية تقوم بتعلم التمثيل من سلسلة إلى سلسلة عن طريق تقسيم الخصائص البصرية بشكل خشن على المحور الأفقي، مما يحد من مرونة التعديلات، حيث قد يؤدي التعديل الهندسي الكبير إلى عدم اتساق في خصائص التمثيل من سلسلة إلى سلسلة. انطلاقًا من هذا الدافع، نقترح طريقة جديدة للتقطير الذاتي من حرف إلى حرف (Character-to-Character Distillation)، اختصاراً CCD، والتي تتيح إجراء تعديلات متعددة لتسهيل تعلم تمثيل النص العام. تحديدًا، نحدد هياكل الحروف في الصور الحقيقية غير المشمولة بالتعليقات من خلال تصميم وحدة تصنيف حروف ذاتية الرقابة. بعد ذلك، يمكن لـ CCD بسهولة زيادة تنوع الحروف المحلية بينما تحتفظ بمطابقتها الزوجية تحت تعديلات مرنة باستخدام مصفوفة التحويل بين وجهين معدلين من الصورة. تظهر التجارب أن CCD تحقق أفضل النتائج حتى الآن، مع زيادة متوسط الأداء بنسبة 1.38% في التعرف على النصوص، 1.7% في تصنيف النصوص، 0.24 ديسيبل (PSNR) و0.0321 (SSIM) في زيادة دقة النصوص. يمكن الوصول إلى الكود في https://github.com/TongkunGuan/CCD.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp