التاريخ

منذ 2 أعوام

المؤسسة

عنوان URL للنشر

www.aishelltech.com

رابط الورقة البحثية

arxiv.org

الوسوم

متعدد الوسائط

المعالجة الصوتية والصوتية

التعرف على الصوت

**تم استخدام مجموعة بيانات HI-MIA في تحدي التحقق من المتحدث AISHELL لعام 2019.**تم استخراجه من قاعدة بيانات أكبر تسمى AISHELL-WakeUp-1. تنقسم مجموعة البيانات إلى مجموعة بيانات HI-MIA ومجموعة تدريب، والمحتوى هو كلمات الاستيقاظ "Hi, Mia" باللغتين الصينية والإنجليزية. تم جمع البيانات في بيئة منزلية حقيقية باستخدام مجموعة ميكروفون وميكروفون عالي الدقة.الورقةتم وصف عملية جمع النظام الأساسي وتطويره. تم استخراج البيانات المستخدمة في التحدي من ميكروفون Hi-Fi واحد ومجموعة ميكروفون دائرية مكونة من 16 قناة بطول 1/3/5 متر. المحتوى هو كلمة الاستيقاظ باللغة الصينية. يتم تقسيم المجموعة بأكملها إلى مجموعات فرعية للقطار (254 شخصًا)، والتطوير (42 شخصًا)، والاختبار (44 شخصًا). توفر مجموعة الاختبار إجابات مستهدفة/غير مستهدفة مقترنة لتقييم نتائج التحقق. **تحتوي قاعدة بيانات صوت AISHELL-WakeUp-1 على 3,936,003 صوتًا لكلمات الاستيقاظ، بإجمالي 1561.12 ساعة.**لغات التسجيل هي الصينية والإنجليزية؛ منطقة التسجيل هي الصين. نص التسجيل هو كلمة الاستيقاظ "مرحبا ميا". وقد دعت هذه المجموعة من البيانات 254 متحدثًا للمشاركة في التسجيل. تم إجراء عملية التسجيل في بيئة منزلية حقيقية، مع إعداد 7 أوضاع تسجيل، باستخدام 6 لوحات تسجيل دائرية من 16 قناة من مجموعة ميكروفون PDM لالتقاط الحديث البعيد (16 كيلو هرتز، 16 بت) وميكروفون واحد عالي الدقة لالتقاط الحديث القريب (44.1 كيلو هرتز، 16 بت). تم نسخ هذه القاعدة البيانات وتعليقها على يد مصححين صوتيين محترفين، كما اجتازت عمليات تفتيش صارمة للجودة، مع معدل دقة الكلمات 100%. يمكن استخدامه في الأبحاث المتعلقة بالتعرف على بصمة الصوت، والتعرف على إيقاظ الصوت، وما إلى ذلك.

تم المساهمة بهذه المجموعة من البيانات من قبل مستخدمي المجتمع وهي مخصصة للأغراض التعليمية والإعلامية فقط. إذا كان أي محتوى ينطوي على انتهاك لحقوق النشر، يرجى الاتصال بنا على [email protected] للمراجعة والإزالة الفورية.

مجموعة بيانات ثقافة الميمات على الإنترنت الصينية zh-meme-sft-8k

منذ 9 أيام

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار