HyperAIHyperAI
منذ 2 أشهر

المسارات السمعية البطيئة والسريعة للاعتراف بالصوت

Kazakos, Evangelos ; Nagrani, Arsha ; Zisserman, Andrew ; Damen, Dima
المسارات السمعية البطيئة والسريعة للاعتراف بالصوت
الملخص

نقترح شبكة تلافيفية ثنائية التيار للاعتراف بالصوت، تعمل على مدخلات الطيف الزمني-الترددي. بعد النجاح المماثل في مجال الاعتراف البصري، نتعلم مسارات سمعية بطيئة وسريعة باستخدام التلافيف المنفصلة والروابط الجانبية متعددة المستويات. المسار البطيء يتمتع بقدرة قنوات عالية بينما يعمل المسار السريع بدقة زمنية دقيقة. نبرز أهمية مقترحنا الثنائي التيار على قاعدتين بيانات مختلفتين: VGG-Sound و EPIC-KITCHENS-100، ونحقق أفضل النتائج الحالية في كليهما.