HyperAIHyperAI
منذ 2 أشهر

دفع حدود كشف الأحداث الصوتية باستخدام التوسيع المتعدد للتردد الدوري الديناميكي

Nam, Hyeonuk ; Park, Yong-Hwa
دفع حدود كشف الأحداث الصوتية باستخدام التوسيع المتعدد للتردد
الدوري الديناميكي
الملخص

الترجمة العربية:الدورة التكرارية الديناميكية للتواتر (FDY conv) كانت نقطة تحول في مجال كشف الأحداث الصوتية (SED)، ولكنها تتضمن زيادة كبيرة في حجم النموذج بسبب وجود العديد من نوى الأساس. في هذا العمل، نقترح الدورة التكرارية الجزئية للتواتر الديناميكي (PFD conv)، والتي تربط مخرجات الدورة التكرارية ثنائية الأبعاد التقليدية وFDY conv كفروع ثابتة وديناميكية على التوالي. يقلل PFD-CRNN الذي يكون فيه نسبة مخرجات الفرع الديناميكي ثُمنَان إلى الثمانية من عدد المعلمات بنسبة 51.9% مقارنة بـ FDY-CRNN مع الحفاظ على الأداء. بالإضافة إلى ذلك، نقترح الدورة التكرارية المتعددة للتوتر الديناميكي (MDFD conv)، والتي تدمج فروعًا متعددة من الدورات التكرارية الموسعة للتوتر الديناميكي (DFD conv) ذات أحجام توسيع مختلفة وفرعًا ثابتًا ضمن طبقة دورية واحدة. حقق أفضل MDFD-CRNN، والذي يتكون من خمسة فروع FDY Conv غير موسعة، وثلاثة فروع DFD Conv موسعة بطرق مختلفة، وفرع ثابت، تحسينًا بنسبة 3.17% في درجة كشف الصوت البوليافوني (PSDS) مقارنة بـ FDY conv دون استخدام مرشح الوسيط لكل فئة. أدى تطبيق صندوق الحدود للأحداث الصوتية كمعالجة ما بعد العملية على أفضل MDFD-CRNN إلى تحقيق قيمة PSDS1 الحقيقية قدرها 0.485، وهي أعلى درجة في مجموعة بيانات DESED دون استخدام مجموعة بيانات خارجية أو نموذج تم تدريبه مسبقًا. من خلال نتائج الدراسات الإلغائية الشاملة، اكتشفنا أن الفروع الديناميكية المتعددة وكذلك نسبة معينة للفرع الثابت تسهم في تحسين KSD. بالإضافة إلى ذلك، تعد الفروع الديناميكية غير الموسعة ضرورية بالإضافة إلى الفروع الديناميكية الموسعة للحصول على أداء كشف الأحداث الصوتية الأمثل. تعزز النتائج والمناقشات حول الدراسات الإلغائية الفهم والاستخدام لنسخ FDY conv.ملاحظة: تم استخدام المصطلح "KSD" بدلاً من "SED" في الجملة الأخيرة لتجنب التكرار، حيث أن "SED" قد تكون غير واضحة للمتحدثين العرب الذين ليسوا على دراية بالاختصارات الإنجليزية. إذا كنت ترغب في الحفاظ على الاختصار "SED"، يمكن تعديل الجملة كما يلي:"تعزز النتائج والمناقشات حول الدراسات الإلغائية الفهم والاستخدام لمتغيرات FDY conv في مجال كشف الأحداث الصوتية (SED)."

دفع حدود كشف الأحداث الصوتية باستخدام التوسيع المتعدد للتردد الدوري الديناميكي | أحدث الأوراق البحثية | HyperAI