HyperAIHyperAI

Command Palette

Search for a command to run...

الضبط التلقائي للتحصيل الطيفي لتمييز المتكلم باستخدام الفجوة ذات القيمة الذاتية القصوى القياسية

Tae Jin Park Kyu J. Han Manoj Kumar Shrikanth Narayanan

الملخص

في هذه الدراسة، نقترح إطارًا جديدًا للتحصيل الطيفي (spectral clustering) قادر على ضبط المعلمات الخاصة بخوارزمية التجميع تلقائيًا في سياق التمييز الصوتي للتحدث (speaker diarization). يستخدم الإطار المقترح قيم الفجوة الذاتية العظمى المعيارية (NME) لتقدير عدد المجموعات، بالإضافة إلى المعلمات الخاصة بالحد الأقصى لعناصر كل صف في مصفوفة التماثل (affinity matrix) أثناء التجميع الطيفي، دون الحاجة إلى ضبط المعلمات باستخدام مجموعة تطوير. وبالرغم من هذا النهج غير المُتدخل (hands-off)، نحقق أداءً مماثلًا أو أفضل من النتائج التي تُسجَّل باستخدام الطرق التقليدية للتحصيل التي تعتمد على ضبط دقيق للمعلمات واستخدام بيانات تطوير. وتُظهر نتيجة تحسن نسبي بنسبة 17% في معدل أخطاء المتحدث على مجموعة التقييم الشهيرة CALLHOME فعالية الإطار المقترح للتحصيل الطيفي مع الضبط التلقائي.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp