HyperAIHyperAI
منذ 16 أيام

الانسيابية الديناميكية لل convoLution: التعرف على الأنماط المتكيفة تردديًا للكشف عن الأحداث الصوتية

Hyeonuk Nam, Seong-Hu Kim, Byeong-Yun Ko, Yong-Hwa Park
الانسيابية الديناميكية لل convoLution: التعرف على الأنماط المتكيفة تردديًا للكشف عن الأحداث الصوتية
الملخص

يُستخدم التدوير ثنائي الأبعاد على نطاق واسع في كشف أحداث الصوت (SED) لتمييز الأنماط الثنائية الأبعاد الزمنية-الترددية لأحداث الصوت. ومع ذلك، فإن التدوير ثنائي الأبعاد يفرض تكافؤ الترجمة على أحداث الصوت في كلا الاتجاهين الزمني والتردد، في حين أن المحور الترددي ليس بعداً غير حساس للانزلاق (shift-invariant). ولتحسين الاتساق الفيزيائي للتدوير ثنائي الأبعاد في تطبيقات كشف أحداث الصوت، نقترح طريقة التدوير الديناميكي الترددي، التي تطبّق نواة تتكيف مع المكونات الترددية للمدخلات. أظهر التدوير الديناميكي الترددي أداءً أفضل بنسبة 6.3% مقارنة بالطريقة الأساسية على مجموعة بيانات التحقق DESED من حيث مؤشر كشف الصوت المتعدد (PSDS). كما يتفوق بشكل ملحوظ على الطرق الأخرى القائمة مسبقاً التي تعتمد على التكيّف مع المحتوى في تطبيقات كشف أحداث الصوت. علاوة على ذلك، من خلال مقارنة مقاييس F1 حسب الفئة بين الطريقة الأساسية والتدوير الديناميكي الترددي، أظهرنا أن التدوير الديناميكي الترددي يكون أكثر فعالية بشكل خاص في كشف أحداث الصوت غير الثابتة ذات الأنماط الزمنية-الترددية المعقدة. ومن هذا الناتج، تأكد أن التدوير الديناميكي الترددي يتفوق في التعرف على الأنماط المرتبطة بالتردد.

الانسيابية الديناميكية لل convoLution: التعرف على الأنماط المتكيفة تردديًا للكشف عن الأحداث الصوتية | أحدث الأوراق البحثية | HyperAI