HyperAIHyperAI

Command Palette

Search for a command to run...

تصنيف الصوت البيئي من البداية إلى النهاية باستخدام شبكة عصبية تلافيفية أحادية البعد

Sajjad Abdoli Patrick Cardinal Alessandro Lameiras Koerich

الملخص

في هذا البحث، نقدم منهجية شاملة لتصنيف الأصوات البيئية تعتمد على شبكة عصبية تلافيفية أحادية البعد (CNN) تتعلم تمثيلًا مباشرًا من الإشارة الصوتية. يتم استخدام عدة طبقات تلافيفية لالتقاط البنية الزمنية الدقيقة للإشارة وتعلم مرشحات متنوعة ذات صلة بمهمة التصنيف. يمكن للمنهجية المقترحة التعامل مع إشارات صوتية بأي طول، حيث تقوم بتقسيم الإشارة إلى إطارات متداخلة باستخدام نافذة منزلقة. تم تقييم هياكل مختلفة مع الأخذ بعين الاعتبار أحجام مدخلات متعددة، بما في ذلك تهيئة الطبقة التلافيفية الأولى باستخدام مرشح غامماتون (Gammatone filterbank) الذي يُحاكي استجابة المرشح السمعي البشري في القوقعة. تم اختبار أداء المنهجية الشاملة المقترحة في تصنيف الأصوات البيئية على مجموعة بيانات UrbanSound8k، وأظهرت النتائج التجريبية أنها حققت دقة متوسطة بنسبة 89%. وبالتالي، فإن المنهجية المقترحة تتفوق على معظم الأساليب الرائدة التي تستعمل خصائص مصممة يدويًا أو تمثيلات ثنائية الأبعاد كمدخلات. بالإضافة إلى ذلك، تحتوي المنهجية المقترحة على عدد قليل من المعالم مقارنة بالهياكل الأخرى الموجودة في الأدب العلمي، مما يقلل من كمية البيانات المطلوبة للتدريب.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp