HyperAIHyperAI

Command Palette

Search for a command to run...

الانسيابية الديناميكية لل convoLution: التعرف على الأنماط المتكيفة تردديًا للكشف عن الأحداث الصوتية

Hyeonuk Nam Seong-Hu Kim Byeong-Yun Ko Yong-Hwa Park

الملخص

يُستخدم التدوير ثنائي الأبعاد على نطاق واسع في كشف أحداث الصوت (SED) لتمييز الأنماط الثنائية الأبعاد الزمنية-الترددية لأحداث الصوت. ومع ذلك، فإن التدوير ثنائي الأبعاد يفرض تكافؤ الترجمة على أحداث الصوت في كلا الاتجاهين الزمني والتردد، في حين أن المحور الترددي ليس بعداً غير حساس للانزلاق (shift-invariant). ولتحسين الاتساق الفيزيائي للتدوير ثنائي الأبعاد في تطبيقات كشف أحداث الصوت، نقترح طريقة التدوير الديناميكي الترددي، التي تطبّق نواة تتكيف مع المكونات الترددية للمدخلات. أظهر التدوير الديناميكي الترددي أداءً أفضل بنسبة 6.3% مقارنة بالطريقة الأساسية على مجموعة بيانات التحقق DESED من حيث مؤشر كشف الصوت المتعدد (PSDS). كما يتفوق بشكل ملحوظ على الطرق الأخرى القائمة مسبقاً التي تعتمد على التكيّف مع المحتوى في تطبيقات كشف أحداث الصوت. علاوة على ذلك، من خلال مقارنة مقاييس F1 حسب الفئة بين الطريقة الأساسية والتدوير الديناميكي الترددي، أظهرنا أن التدوير الديناميكي الترددي يكون أكثر فعالية بشكل خاص في كشف أحداث الصوت غير الثابتة ذات الأنماط الزمنية-الترددية المعقدة. ومن هذا الناتج، تأكد أن التدوير الديناميكي الترددي يتفوق في التعرف على الأنماط المرتبطة بالتردد.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp