HyperAIHyperAI

Command Palette

Search for a command to run...

مجموعة بيانات أسئلة الصوت البسيطة

التاريخ

منذ 12 ساعات

المؤسسة

Google

الترخيص

CC BY 4.0

أسئلة الصوت البسيطة (SVQ) هي مجموعة بيانات صوتية قصيرة أصدرتها جوجل وهي عنصر تقييم أساسي لمعيار تضمين الصوت الضخم (MSEB). تتضمن هذه المجموعة بيانات صوتية متعددة اللغات، تحتوي على أسئلة صوتية قصيرة بـ 17 لغة من 26 منطقة، بإجمالي حوالي 700 متحدث. وقدّم كل متحدث ما يصل إلى 250 عينة صوتية، تغطي لغات متعددة منها العربية والإنجليزية واليابانية والكورية والهندية. كما تشمل ظروف تسجيل متنوعة، مثل البيئات الهادئة، وأصوات الخلفية، وضوضاء المرور. وتم تصنيف البيانات حسب جنس المتحدثين، بما في ذلك الإناث والذكور وغير الثنائيين، بالإضافة إلى فئة "لم يُجب"، مما يُظهر تنوعًا كبيرًا في كل من اللغة والسيناريوهات الصوتية.

حقول البيانات:

  • utt_id: سلسلة نصية تمثل معرفًا فريدًا للتسجيل.
  • شكل الموجة: نوع الصوت، معدل أخذ العينات 16000.
  • locale: سلسلة نصية تمثل منطقة التسجيل.
  • speaker_id: سلسلة نصية تمثل معرفًا فريدًا للمتحدث.
  • عمر المتحدث: عدد صحيح مكون من 32 بت يمثل عمر المتحدث.
  • جنس المتحدث: سلسلة نصية تمثل جنس المتحدث.
  • البيئة: سلسلة نصية تمثل بيئة التسجيل.
  • النص: نوع سلسلة نصية يمثل محتوى النص المسجل.
  • topk_salient_terms: قائمة من السلاسل النصية التي تمثل الكلمات الرئيسية.
  • topk_salient_terms_timestamps: قائمة من الأرقام العشرية التي تمثل الطوابع الزمنية للكلمات الرئيسية.

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp