HyperAIHyperAI
منذ 17 أيام

الساعات الزمنية وما شابهها: معيار عملي لفهم اللغة المسموعة مع الأرقام

Loren Lugosch, Piyush Papreja, Mirco Ravanelli, Abdelwahab Heba, Titouan Parcollet
الساعات الزمنية وما شابهها: معيار عملي لفهم اللغة المسموعة مع الأرقام
الملخص

يقدّم هذا البحث مجموعة بيانات مفتوحة المصدر جديدة تُسمّى "Timers and Such"، وهي مجموعة بيانات مصوّتة باللغة الإنجليزية تحتوي على أوامر شائعة لتحكم صوتي تتضمّن أرقامًا. ونُبيّن الفجوة الموجودة في مجموعات بيانات فهم اللغة المسموعة الحالية التي تُغطّيها هذه المجموعة، ونُفصّل تصميم إنشاء المجموعة وتقديمها، بالإضافة إلى تجارب أجريناها على عدد من النماذج الأساسية القائمة على ASR والنموذج المتكامل من البداية إلى النهاية، مع تزويد المصدر البرمجي الخاص بها ضمن أداة SpeechBrain.

الساعات الزمنية وما شابهها: معيار عملي لفهم اللغة المسموعة مع الأرقام | أحدث الأوراق البحثية | HyperAI