HyperAIHyperAI
منذ 2 أشهر

خسارة النهاية إلى النهاية المعممة لتحقق من المتحدث

Li Wan; Quan Wang; Alan Papir; Ignacio Lopez Moreno
خسارة النهاية إلى النهاية المعممة لتحقق من المتحدث
الملخص

في هذه الورقة، نقترح دالة خسارة جديدة تسمى الخسارة النهاية إلى النهاية المعممة (GE2E)، والتي تجعل تدريب نماذج التحقق من هوية المتحدث أكثر كفاءة مقارنة بدالة الخسارة النهاية إلى النهاية القائمة على الأزواج (TE2E) السابقة لدينا. بخلاف TE2E، تقوم دالة الخسارة GE2E بتحديث الشبكة بطريقة تركز على الأمثلة التي تكون صعبة التحقق في كل خطوة من عملية التدريب. بالإضافة إلى ذلك، لا تتطلب دالة الخسارة GE2E مرحلة أولية لاختيار الأمثلة. بهذه الخصائص، يقلل نموذجنا مع الدالة الجديدة للخسارة من معدل الخطأ في التحقق من هوية المتحدث (EER) بنسبة تزيد عن 10٪، بينما يقلل أيضًا من وقت التدريب بنسبة 60٪ في نفس الوقت. كما نقدم تقنية MultiReader، والتي تتيح لنا إجراء التكيف بين المجالات - تدريب نموذج أكثر دقة يدعم كلمات مفتاح متعددة (مثل "OK Google" و "Hey Google") وكذلك لهجات متعددة.