HyperAIHyperAI

Command Palette

Search for a command to run...

تقييم نماذج التحويل من تسلسل إلى تسلسل للاعتراف بالنصوص المكتوبة بخط اليد

Johannes Michael Roger Labahn Tobias Grüning Jochen Zöllner

الملخص

قد أصبحت نماذج المُشفر-المُفكك (Encoder-decoder) طريقة فعالة للمهام المتعلقة بتعلم التسلسلات مثل الترجمة الآلية ووصف الصور وتعرف النطق، ولكنها لم تظهر نتائج تنافسية حتى الآن في مجال التعرف على النصوص المكتوبة باليد. بهدف تحقيق هذا، نقترح نموذج تسلسل إلى تسلسل يعتمد على الانتباه (attention-based sequence-to-sequence model). يجمع هذا النموذج بين شبكة عصبية تقنية الإدراك الشامل (Convolutional Neural Network) كمستخرج عام للميزات وشبكة عصبية متكررة لترميز المعلومات البصرية بالإضافة إلى السياق الزمني بين الحروف في الصورة المدخلة، ويستخدم شبكة عصبية متكررة منفصلة لفك شفرة التسلسل الفعلي للحروف. نقوم بإجراء مقارنات تجريبية بين آليات مختلفة للانتباه والترميز الموضعي (positional encodings) للعثور على تماثل مناسب بين التسلسل المدخل والتسلسل المخرج. يمكن تدريب النموذج بطريقة شاملة من البداية إلى النهاية (end-to-end)، ويسمح دمج الخسارة الهجينة الاختياري للمساحف بتخزين إخراج قابل للتفسير والاستخدام إذا رغبت في ذلك. نحقق نتائج تنافسية على مجموعتي بيانات IAM وICFHR2016 READ مقارنة بأحدث التقنيات دون استخدام نموذج لغوي، ونحسن بشكل كبير على أي منهجيات حديثة للتسلسل إلى التسلسل.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
تقييم نماذج التحويل من تسلسل إلى تسلسل للاعتراف بالنصوص المكتوبة بخط اليد | مستندات | HyperAI