HyperAIHyperAI

Command Palette

Search for a command to run...

التعرف على النص اليدوي غير المقيد دون تكرار باستخدام شبكة تلافيفية كاملة مزودة بمنفذ

Denis Coquenet Clément Chatelain Thierry Paquet

الملخص

تمثّل القدرة على التعرف على النص المكتوب بخط اليد دون قيود خطوة رئيسية في معظم مهام تحليل المستندات. ويتم معالجة هذه المهمة عادةً باستخدام الشبكات العصبية العميقة ذات التكرار (RNN)، وبشكل خاص من خلال استخدام خلايا الذاكرة طويلة المدى (LSTM). وتشمل العيوب الرئيسية لهذه المكونات العدد الكبير من المعاملات المطلوبة، بالإضافة إلى تنفيذها التسلسلي أثناء التدريب والتنبؤ. إحدى الحلول البديلة لاستخدام خلايا LSTM هي تعويض فقدان الذاكرة الطويلة المدى من خلال الاستفادة الواسعة من الطبقات التلافيفية (Convolutional Layers)، التي يمكن تنفيذ عملياتها بالتوازي، وتتطلب عددًا أقل من المعاملات. في هذه الورقة، نقدّم بنية شبكة مُتحكّمة بالكامل تلافيفية (Gated Fully Convolutional Network) كحل بديل خالٍ من التكرار للهياكل المعروفة مثل CNN+LSTM. تم تدريب نموذجنا باستخدام خسارة CTC، وأظهر نتائج تنافسية على كلا المجموعتين RIMES وIAM. ونُشر كل كود التجريبي لتمكين إعادة إنتاج تجاربنا: https://github.com/FactoDeepLearning/LinePytorchOCR.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp