HyperAIHyperAI
منذ 2 أشهر

تحديد اللغة باستخدام الشبكات العصبية التكرارية التوलيفية العميقة

Christian Bartz; Tom Herold; Haojin Yang; Christoph Meinel
الملخص

تُستخدم أنظمة تحديد اللغة (LID) لتصنيف اللغة المنطوقة من عينة صوتية معطاة، وهي غالبًا الخطوة الأولى في العديد من مهام معالجة اللغة المنطوقة، مثل أنظمة التعرف على الكلام تلقائيًا (ASR). بدون الكشف التلقائي عن اللغة، لا يمكن تحليل الجمل الصوتية بشكل صحيح ولا يمكن تطبيق قواعد النحو، مما يؤدي إلى فشل خطوات التعرف على الكلام اللاحقة. نقترح نظامًا لتحديد اللغة (LID) يحل المشكلة في مجال الصور بدلاً من المجال الصوتي. نحن نستخدم شبكة عصبية هجينة تكرارية ارتكازية (CRNN) تعمل على صور الطيف الزمني للippets الصوتية المقدمة. في تجارب واسعة النطاق، نظهر أن نموذجنا قابل للتطبيق في مجموعة متنوعة من السيناريوهات الضوضائية ويمكن توسيعه بسهولة إلى اللغات غير المعروفة سابقًا مع الحفاظ على دقة تصنيفه. نقوم بإطلاق شفرتنا ومجموعة تدريب كبيرة لنظم تحديد اللغة (LID) للمجتمع.注:在最后一句中,“ippts”可能是原文中的拼写错误,应该是“snippets”。因此,我将其翻译为“ippets الصوتية”,但建议您检查原文并确认是否需要更正为“snippets الصوتية”。

تحديد اللغة باستخدام الشبكات العصبية التكرارية التوलيفية العميقة | أحدث الأوراق البحثية | HyperAI