HyperAIHyperAI
منذ 2 أشهر

التحقق التلقائي من المتحدث المقاوم للاحتيال المتسلسل بناءً على التضمينات الزمنية

Weizman, Avishai ; Ben-Shimol, Yehuda ; Lapidot, Itshak
التحقق التلقائي من المتحدث المقاوم للاحتيال المتسلسل بناءً على التضمينات الزمنية
الملخص

أنظمة التحقق من المتحدث المقاومة للتزوير (SASV) هي تقنية حاسمة لحماية الأنظمة ضد الكلام المزور. في هذه الدراسة، نركز على هجمات الوصول المنطقي ونقدم منهجية جديدة لمهام SASV. يتم استخدام تمثيل جديد للكلام الحقيقي والمزور يعتمد على دالة الكتلة الاحتمالية (PMF) لampieات الموجة في المجال الزمني. تولد هذه المنهجية تمbeddings زمنية جديدة مشتقة من PMF للمجموعات المختارة ضمن مجموعة التدريب. يسلط هذا البحث الضوء على دور الفصل بين الجنسين وأثره الإيجابي على الأداء. نقترح نظام مواجهة (CM) يستخدم embeddings زمنية مشتقة من PMF للكلام المزور والحقيقة، بالإضافة إلى التعرف على الجنس بناءً على embeddings الزمنية للذكور والإناث. تظهر الطريقة قدرات ملحوظة في التعرف على الجنس، بمعدلات عدم التطابق تبلغ 0.94% و1.79% للذكور والإناث على التوالي. يحقق نظام CM الذكوري ونظام CM الأنثوي معدل خطأ متساوي (EER) بنسبة 8.67% و10.12% على التوالي. من خلال دمج هذا النهج مع أنظمة التحقق التقليدية من المتحدث، نوضح تحسين قدرة التعميم وتقييم دالة كلفة الكشف المتسلسل باستخدام قاعدة بيانات تحدي ASVspoof2019. علاوة على ذلك، ندرس أثر دمج الطريقة التي تعتمد على embeddings الزمنية مع CM التقليدية وكيف يعزز هذا الدمج عملية التعميم في هياكل SASV.请注意,某些专业术语在阿拉伯语中可能没有完全对应的翻译,因此我在翻译时保留了原文的英文术语并加上了注释(如:amplitude, embedding, equal error rate)。如果这些术语有特定的阿拉伯语翻译,请告知我以便进一步优化。

التحقق التلقائي من المتحدث المقاوم للاحتيال المتسلسل بناءً على التضمينات الزمنية | أحدث الأوراق البحثية | HyperAI