الملخص

يقدّم هذا البحث أداة التعرف على الكلام FunASR، وهي أداة مفتوحة المصدر مصممة لسد الفجوة بين الأبحاث الأكاديمية والتطبيقات الصناعية. توفر FunASR نماذج تم تدريبها على مجموعات بيانات صوتية صناعية ضخمة، بالإضافة إلى إمكانية نشرها في تطبيقات عملية. يُعدّ النموذج الرئيسي في الأداة، Paraformer، نموذجًا متكاملًا غير تكراري للتعرف على الكلام، وقد تم تدريبه على مجموعة بيانات صوتية من الصينية المعيارية تم تسميتها يدويًا وتشمل 60,000 ساعة من السمع. ولتحسين أداء Paraformer، أضفنا إلى الهيكل الأساسي للنموذج قدرات جديدة تشمل توقع التوقيت الزمني (timestamp prediction) ودعم تخصيص الكلمات المفتاحية (hotword customization). علاوة على ذلك، لتسهيل نشر النماذج، أُطلقت مفتوحة المصدر نموذجان: الأول هو نموذج كشف النشاط الصوتي (Voice Activity Detection) المستند إلى الشبكة التسلسلية ذات الذاكرة المُغذاة أمامًا (FSMN-VAD)، والثاني هو نموذج ما بعد معالجة النص لوضع علامات الترقيم المستند إلى نموذج المُحول ذي التأخير القابل للتحكم (CT-Transformer)، وقد تم تدريب كلا النموذجين على مجموعات بيانات صناعية. توفر هذه الوحدات الوظيفية أساسًا قويًا لبناء خدمات للتعرف على الكلام في الملفات الصوتية الطويلة ذات الدقة العالية. ومقارنةً بالنماذج الأخرى المدربة على مجموعات بيانات مفتوحة، تُظهر Paraformer أداءً متفوقًا.

ملف PDF المصدر

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا

سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين

مدعوم بواسطة MailChimp

الملخص

Command Palette

FunASR: أداة تعرف صوتيّة متكاملة أساسية

Zhifu Gao Zerui Li Jiaming Wang Haoneng Luo Xian Shi Mengzhe Chen Yabin Li Lingyun Zuo Zhihao Du Zhangyu Xiao1 more

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

FunASR: أداة تعرف صوتيّة متكاملة أساسية

Zhifu Gao Zerui Li Jiaming Wang Haoneng Luo Xian Shi Mengzhe Chen Yabin Li Lingyun Zuo Zhihao Du Zhangyu Xiao1 more

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

FunASR: أداة تعرف صوتيّة متكاملة أساسية

Zhifu Gao Zerui Li Jiaming Wang Haoneng Luo Xian Shi Mengzhe Chen Yabin Li Lingyun Zuo Zhihao Du Zhangyu Xiao1 more

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Zhifu Gao Zerui Li Jiaming Wang Haoneng Luo Xian Shi Mengzhe Chen Yabin Li Lingyun Zuo Zhihao Du Zhangyu Xiao

Zhifu Gao Zerui Li Jiaming Wang Haoneng Luo Xian Shi Mengzhe Chen Yabin Li Lingyun Zuo Zhihao Du Zhangyu Xiao

Zhifu Gao Zerui Li Jiaming Wang Haoneng Luo Xian Shi Mengzhe Chen Yabin Li Lingyun Zuo Zhihao Du Zhangyu Xiao