منذ 6 أشهر

Yassir Fathullah Chunyang Wu Yuan Shangguan Junteng Jia Wenhan Xiong Jay Mahadeokar Chunxi Liu Yangyang Shi Ozlem Kalinli Mike Seltzer

الملخص

أظهرت نماذج الفضاء الحالة (SSMs) مؤخرًا نتائج واعدة في مهام التسلسل الصغيرة ونمذجة اللغة، تتفوق أو توازي العديد من النماذج القائمة على الانتباه. في هذه الورقة، نقترح معمارية متعددة الرؤوس للفضاء الحالة (MH-SSM) مزودة بآليات توجيه خاصة، حيث تُدرّس الرؤوس المتوازية على تعلّم الديناميكيات الزمنية المحلية والعالمية في بيانات التسلسل. بوصفها بديلًا مباشرًا لآلية الانتباه متعددة الرؤوس في مُشَبّكات الترانسفورمر، تتفوّق هذه النموذج الجديد بشكل كبير على نموذج الترانسفورمر-المحول (Transformer Transducer) على مجموعة بيانات التعرف على الصوت LibriSpeech. علاوةً على ذلك، قمنا بتعزيز وحدة الترانسفورمر بإضافة طبقات MH-SSM، والمعروفة باسم Stateformer، مما أتاح تحقيق أداء متقدّم جدًا في مهمة LibriSpeech، بواقع معدلات أخطاء كلمات قدرها 1.76٪/4.37٪ على مجموعة التدريب، و1.91٪/4.36٪ على مجموعة الاختبار، دون استخدام نموذج لغوي خارجي.

ملف PDF المصدر

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا

سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين

مدعوم بواسطة MailChimp

الملخص

HyperAI

منذ 6 أشهر

Transformer

المعالجة الصوتية والصوتية

معالجة اللغة الطبيعية

النهج/المعمارية

معالجة اللغة الطبيعية

صوتيات

مهمة

Yassir Fathullah Chunyang Wu Yuan Shangguan Junteng Jia Wenhan Xiong Jay Mahadeokar Chunxi Liu Yangyang Shi Ozlem Kalinli Mike Seltzer

الملخص

ملف PDF المصدر

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا

سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين

مدعوم بواسطة MailChimp

Command Palette

نموذج حالة متعددة الرؤوس لنموذج التعرف على الصوت

Yassir Fathullah Chunyang Wu Yuan Shangguan Junteng Jia Wenhan Xiong Jay Mahadeokar Chunxi Liu Yangyang Shi Ozlem Kalinli Mike Seltzer1 more

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

نموذج حالة متعددة الرؤوس لنموذج التعرف على الصوت

Yassir Fathullah Chunyang Wu Yuan Shangguan Junteng Jia Wenhan Xiong Jay Mahadeokar Chunxi Liu Yangyang Shi Ozlem Kalinli Mike Seltzer1 more

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

نموذج حالة متعددة الرؤوس لنموذج التعرف على الصوت

Yassir Fathullah Chunyang Wu Yuan Shangguan Junteng Jia Wenhan Xiong Jay Mahadeokar Chunxi Liu Yangyang Shi Ozlem Kalinli Mike Seltzer1 more

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Yassir Fathullah Chunyang Wu Yuan Shangguan Junteng Jia Wenhan Xiong Jay Mahadeokar Chunxi Liu Yangyang Shi Ozlem Kalinli Mike Seltzer

Yassir Fathullah Chunyang Wu Yuan Shangguan Junteng Jia Wenhan Xiong Jay Mahadeokar Chunxi Liu Yangyang Shi Ozlem Kalinli Mike Seltzer

Yassir Fathullah Chunyang Wu Yuan Shangguan Junteng Jia Wenhan Xiong Jay Mahadeokar Chunxi Liu Yangyang Shi Ozlem Kalinli Mike Seltzer