مجموعة بيانات التعرف على الكلام CHiME-5
التاريخ
رابط النشر
رابط الورقة البحثية

CHiME-5 عبارة عن مجموعة بيانات حول تقنية معالجة التعرف التلقائي على الكلام. تأتي مجموعة البيانات من تحدي CHiME الخامس، والذي يتضمن مهمة إجراء محادثة طويلة المدى باستخدام ميكروفونات متعددة في بيئة منزلية حقيقية. يتم استخراج مادة الكلام من مشهد العشاء. تحصل مجموعة البيانات على بيانات كلام المحادثة الطبيعية ويتم تسجيلها بواسطة 6 مجموعات ميكروفون Kinect و 4 أزواج من الميكروفون الثنائي الأذن.
تتضمن مجموعة البيانات إجراءات جمع البيانات والمهام وأنظمة الأساس لنمذجة اللغة ذات المسار الفردي والمتعدد المصفوفات بالإضافة إلى مزامنة المصفوفات وتحسين الكلام والتعرف التلقائي على الكلام التقليدي ونهاية إلى نهاية.
بناء الذكاء الاصطناعي بالذكاء الاصطناعي
من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.