HyperAIHyperAI
منذ 2 أشهر

تصنيف الصوت البيئي من البداية إلى النهاية باستخدام شبكة عصبية تلافيفية أحادية البعد

Abdoli, Sajjad ; Cardinal, Patrick ; Koerich, Alessandro Lameiras
تصنيف الصوت البيئي من البداية إلى النهاية باستخدام شبكة عصبية تلافيفية أحادية البعد
الملخص

في هذا البحث، نقدم منهجية شاملة لتصنيف الأصوات البيئية تعتمد على شبكة عصبية تلافيفية أحادية البعد (CNN) تتعلم تمثيلًا مباشرًا من الإشارة الصوتية. يتم استخدام عدة طبقات تلافيفية لالتقاط البنية الزمنية الدقيقة للإشارة وتعلم مرشحات متنوعة ذات صلة بمهمة التصنيف. يمكن للمنهجية المقترحة التعامل مع إشارات صوتية بأي طول، حيث تقوم بتقسيم الإشارة إلى إطارات متداخلة باستخدام نافذة منزلقة. تم تقييم هياكل مختلفة مع الأخذ بعين الاعتبار أحجام مدخلات متعددة، بما في ذلك تهيئة الطبقة التلافيفية الأولى باستخدام مرشح غامماتون (Gammatone filterbank) الذي يُحاكي استجابة المرشح السمعي البشري في القوقعة. تم اختبار أداء المنهجية الشاملة المقترحة في تصنيف الأصوات البيئية على مجموعة بيانات UrbanSound8k، وأظهرت النتائج التجريبية أنها حققت دقة متوسطة بنسبة 89%. وبالتالي، فإن المنهجية المقترحة تتفوق على معظم الأساليب الرائدة التي تستعمل خصائص مصممة يدويًا أو تمثيلات ثنائية الأبعاد كمدخلات. بالإضافة إلى ذلك، تحتوي المنهجية المقترحة على عدد قليل من المعالم مقارنة بالهياكل الأخرى الموجودة في الأدب العلمي، مما يقلل من كمية البيانات المطلوبة للتدريب.

تصنيف الصوت البيئي من البداية إلى النهاية باستخدام شبكة عصبية تلافيفية أحادية البعد | أحدث الأوراق البحثية | HyperAI