HyperAIHyperAI

Command Palette

Search for a command to run...

منذ 4 أشهر

Odyssey 2024 - تحدي التعرف على العواطف الصوتية: مجموعة البيانات، الإطار الأساسي، والنتائج

{Carlos Busso Berrak Sisman Najim Dehak Leibny Paola Garcia Thomas Thebaud Laureano Moro Velazquez Abinay R. Naini Ali N. Salman Lucas Goncalves}

الملخص

يهدف تحدي التعرف على المشاعر من خلال الكلام (SER) Odysseus 2024 إلى تعزيز الابتكار في التعرف على المشاعر من الكلام الطبيعي، وذلك بالانتقال إلى ما وراء المجموعات التقليدية المستمدة من سيناريوهات مُمَثَّلة. ويقدِّم هذا التحدي تدريبًا وتطويرًا مستقلين عن المُتحدث، بالإضافة إلى مجموعة اختبار حصرية، جميعها مُعلَّمة لمسارين رئيسيين في هذا التحدي: مهام التعرف على المشاعر الفئوية ومهام التعرف على المشاعر المُوصوفة بسمات. ويشجع هذا المبادرة التعاون بين الباحثين لتطوير تقنيات التعرف على المشاعر التي تعمل بدقة في البيئات الواقعية، ويدعو الباحثين إلى استكشاف مناهج مبتكرة تستفيد من أحدث التطورات في معالجة الصوت للتعامل مع مهام التعرف على المشاعر. في هذا البحث، نقدم وصفًا مفصلاً للنقطة المرجعية (Baseline)، وجدول التصنيف (Leaderboard)، وتقييم النتائج، ونقاشًا للنتائج الأساسية. يمكن العثور على موقع التحدي مع جدول التصنيف، وروابط الشفرة المرجعية، والإرشادات من خلال الرابط التالي: https://lab-msp.com/MSP-Podcast_Competition/leaderboard.php

المعايير القياسية

معيار قياسيالمنهجيةالمقاييس
speech-emotion-recognition-on-msp-podcastwavlm
CCC: 0.6466753
speech-emotion-recognition-on-msp-podcast-1wavlm
CCC: 0.7465055
speech-emotion-recognition-on-msp-podcast-2wavlm
CCC: 0.6712493

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة المشتركة بالذكاء الاصطناعي
وحدات معالجة رسومات جاهزة
أفضل الأسعار
ابدأ الآن

Hyper Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp