AISHELL-Hi, Mia قاعدة بيانات صوتية لكلمات الاستيقاظ باللغتين الصينية والإنجليزية
تم استخدام مجموعة بيانات HI-MIA في تحدي التحقق من المتحدث AISHELL لعام 2019.تم استخراجه من قاعدة بيانات أكبر تسمى AISHELL-WakeUp-1.
تنقسم مجموعة البيانات إلى مجموعة بيانات HI-MIA ومجموعة تدريب، والمحتوى هو كلمات الاستيقاظ "Hi, Mia" باللغتين الصينية والإنجليزية. تم جمع البيانات في بيئة منزلية حقيقية باستخدام مجموعة ميكروفون وميكروفون عالي الدقة.الورقةتم وصف عملية جمع النظام الأساسي وتطويره. تم استخراج البيانات المستخدمة في التحدي من ميكروفون Hi-Fi واحد ومجموعة ميكروفون دائرية مكونة من 16 قناة بطول 1/3/5 متر. المحتوى هو كلمة الاستيقاظ باللغة الصينية. يتم تقسيم المجموعة بأكملها إلى مجموعات فرعية للقطار (254 شخصًا)، والتطوير (42 شخصًا)، والاختبار (44 شخصًا). توفر مجموعة الاختبار إجابات مستهدفة/غير مستهدفة مقترنة لتقييم نتائج التحقق.
تحتوي قاعدة بيانات صوت AISHELL-WakeUp-1 على 3,936,003 صوتًا لكلمات الاستيقاظ، بإجمالي 1561.12 ساعة.لغات التسجيل هي الصينية والإنجليزية؛ منطقة التسجيل هي الصين. نص التسجيل هو كلمة الاستيقاظ "مرحبا ميا". وقد دعت هذه المجموعة من البيانات 254 متحدثًا للمشاركة في التسجيل. تم إجراء عملية التسجيل في بيئة منزلية حقيقية، مع إعداد 7 أوضاع تسجيل، باستخدام 6 لوحات تسجيل دائرية من 16 قناة من مجموعة ميكروفون PDM لالتقاط الحديث البعيد (16 كيلو هرتز، 16 بت) وميكروفون واحد عالي الدقة لالتقاط الحديث القريب (44.1 كيلو هرتز، 16 بت). تم نسخ هذه القاعدة البيانات وتعليقها على يد مصححين صوتيين محترفين، كما اجتازت عمليات تفتيش صارمة للجودة، مع معدل دقة الكلمات 100%. يمكن استخدامه في الأبحاث المتعلقة بالتعرف على بصمة الصوت، والتعرف على إيقاظ الصوت، وما إلى ذلك.