HyperAIHyperAI

Command Palette

Search for a command to run...

نماذج مستندة إلى الانتباه للاعتراف بالكلام

Jan Chorowski Dzmitry Bahdanau Dmitriy Serdyuk Kyunghyun Cho Yoshua Bengio

الملخص

المولدات التكرارية للسلسلة التي يتم تكييفها على البيانات الإدخالية من خلال آلية الانتباه أظهرت مؤخرًا أداءً جيدًا للغاية في مجموعة متنوعة من المهام، بما في ذلك الترجمة الآلية، تركيب الكتابة باليد وإنشاء التعليقات الصوتية للصور. نوسع آلية الانتباه بإضافة الخصائص اللازمة للاعتراف بالكلام. نوضح أن بينما يصل نموذج تم تعديله من النموذج المستخدم في الترجمة الآلية إلى معدل خطأ فونيمي (PER) تنافسي يبلغ 18.7٪ في مهمة الاعتراف بالفونيمات في TIMIT، فإنه يمكن تطبيقه فقط على العبارات التي تكون تقريبًا بنفس طول العبارات التي تم تدريبه عليها. نقدم تفسيرًا كميائيًا لهذا الفشل ونقترح طريقة جديدة ومبتكرة لإضافة الوعي بالموقع إلى آلية الانتباه لتخفيف هذه المشكلة. الطريقة الجديدة تؤدي إلى نموذج قوي أمام المدخلات الطويلة ويحقق معدل خطأ فونيمي (PER) يبلغ 18٪ في العبارات المنفردة و20٪ في العبارات الأطول بعشر مرات (المكررة). أخيرًا، نقترح تعديلًا على آلية الانتباه يمنعها من التركيز بشكل كبير جدًا على الإطارات الفردية، مما يقلل المزيد من معدل الخطأ الفونيمي (PER) إلى مستوى 17.6٪.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
نماذج مستندة إلى الانتباه للاعتراف بالكلام | مستندات | HyperAI