Command Palette
Search for a command to run...
مجموعة بيانات أسئلة الصوت البسيطة
أسئلة الصوت البسيطة (SVQ) هي مجموعة بيانات صوتية قصيرة أصدرتها جوجل وهي عنصر تقييم أساسي لمعيار تضمين الصوت الضخم (MSEB). تتضمن هذه المجموعة بيانات صوتية متعددة اللغات، تحتوي على أسئلة صوتية قصيرة بـ 17 لغة من 26 منطقة، بإجمالي حوالي 700 متحدث. وقدّم كل متحدث ما يصل إلى 250 عينة صوتية، تغطي لغات متعددة منها العربية والإنجليزية واليابانية والكورية والهندية. كما تشمل ظروف تسجيل متنوعة، مثل البيئات الهادئة، وأصوات الخلفية، وضوضاء المرور. وتم تصنيف البيانات حسب جنس المتحدثين، بما في ذلك الإناث والذكور وغير الثنائيين، بالإضافة إلى فئة "لم يُجب"، مما يُظهر تنوعًا كبيرًا في كل من اللغة والسيناريوهات الصوتية.
حقول البيانات:
- utt_id: سلسلة نصية تمثل معرفًا فريدًا للتسجيل.
- شكل الموجة: نوع الصوت، معدل أخذ العينات 16000.
- locale: سلسلة نصية تمثل منطقة التسجيل.
- speaker_id: سلسلة نصية تمثل معرفًا فريدًا للمتحدث.
- عمر المتحدث: عدد صحيح مكون من 32 بت يمثل عمر المتحدث.
- جنس المتحدث: سلسلة نصية تمثل جنس المتحدث.
- البيئة: سلسلة نصية تمثل بيئة التسجيل.
- النص: نوع سلسلة نصية يمثل محتوى النص المسجل.
- topk_salient_terms: قائمة من السلاسل النصية التي تمثل الكلمات الرئيسية.
- topk_salient_terms_timestamps: قائمة من الأرقام العشرية التي تمثل الطوابع الزمنية للكلمات الرئيسية.
بناء الذكاء الاصطناعي بالذكاء الاصطناعي
من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.