HyperAIHyperAI

Command Palette

Search for a command to run...

التدريج المزدوج للمعرفة للكشف الفعّال عن الأحداث الصوتية

Xiao Yang ; Das Rohan Kumar

الملخص

الكشف عن الأحداث الصوتية (SED) ضروري لتحديد الأصوات المحددة ومواقعها الزمنية داخل الإشارات الصوتية. ويصبح هذا التحدي أكبر خاصة في التطبيقات على الجهاز، حيث تكون الموارد الحاسوبية محدودة. لمعالجة هذه المشكلة، نقدم في هذا العمل إطارًا جديدًا يُعرف بـ "التقليص المعرفي الثنائي" لتطوير أنظمة SED فعالة. يبدأ التقليص المعرفي الثنائي المقترح بالتقليص المعرفي المتوسط زمنيًا (TAKD)، باستخدام نموذج طالب متوسط يتم استنتاجه من متوسط معاملات نموذج الطالب الزمني. وهذا يسمح لنموذج الطالب بالتعلم بشكل غير مباشر من نموذج المعلم المدرب مسبقًا، مما يضمن تقليصًا معرفيًا مستقرًا. بعد ذلك، نقدم التقليص المعرفي المعزز بالمتجهات (EEFD)، والذي يتضمن إدخال طبقة تقليص معرفي للمتجهات داخل نموذج الطالب لتعزيز التعلم السياقي.على مجموعة البيانات العامة لتقييم مهمة DCASE 2023 Task 4A، أظهر نظام SED المقترح لدينا مع التقليص المعرفي الثنائي تفوقًا في الأداء بمعدلات PSDS1 وPSDS2، رغم أنه يحتوي على ثلث معاملات النموذج الأساسي فقط. وهذا يؤكد أهمية التقليص المعرفي الثنائي المقترح لأنظمة SED المتراصة، والتي يمكن أن تكون مثالية للأجهزة الحوافية.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
التدريج المزدوج للمعرفة للكشف الفعّال عن الأحداث الصوتية | مستندات | HyperAI