استخدم مجموعة البيانات هذه ناقش على Discord

التاريخ

منذ 3 أشهر

المؤسسة

الترخيص

CC BY 4.0

الوسوم

Google

لغة

التعرف على الصوت

أسئلة الصوت البسيطة (SVQ) هي مجموعة بيانات صوتية قصيرة أصدرتها جوجل وهي عنصر تقييم أساسي لمعيار تضمين الصوت الضخم (MSEB). تتضمن هذه المجموعة بيانات صوتية متعددة اللغات، تحتوي على أسئلة صوتية قصيرة بـ 17 لغة من 26 منطقة، بإجمالي حوالي 700 متحدث. وقدّم كل متحدث ما يصل إلى 250 عينة صوتية، تغطي لغات متعددة منها العربية والإنجليزية واليابانية والكورية والهندية. كما تشمل ظروف تسجيل متنوعة، مثل البيئات الهادئة، وأصوات الخلفية، وضوضاء المرور. وتم تصنيف البيانات حسب جنس المتحدثين، بما في ذلك الإناث والذكور وغير الثنائيين، بالإضافة إلى فئة "لم يُجب"، مما يُظهر تنوعًا كبيرًا في كل من اللغة والسيناريوهات الصوتية.

حقول البيانات:

utt_id: سلسلة نصية تمثل معرفًا فريدًا للتسجيل.
شكل الموجة: نوع الصوت، معدل أخذ العينات 16000.
locale: سلسلة نصية تمثل منطقة التسجيل.
speaker_id: سلسلة نصية تمثل معرفًا فريدًا للمتحدث.
عمر المتحدث: عدد صحيح مكون من 32 بت يمثل عمر المتحدث.
جنس المتحدث: سلسلة نصية تمثل جنس المتحدث.
البيئة: سلسلة نصية تمثل بيئة التسجيل.
النص: نوع سلسلة نصية يمثل محتوى النص المسجل.
topk_salient_terms: قائمة من السلاسل النصية التي تمثل الكلمات الرئيسية.
topk_salient_terms_timestamps: قائمة من الأرقام العشرية التي تمثل الطوابع الزمنية للكلمات الرئيسية.

تم المساهمة بهذه المجموعة من البيانات من قبل مستخدمي المجتمع وهي مخصصة للأغراض التعليمية والإعلامية فقط. إذا كان أي محتوى ينطوي على انتهاك لحقوق النشر، يرجى الاتصال بنا على [email protected] للمراجعة والإزالة الفورية.

مجموعة بيانات MDPBench المعيارية لتحليل المستندات متعددة اللغات

منذ 22 أيام

مجموعة بيانات الكشف عن البريد الإلكتروني العشوائي

منذ 3 أشهر

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا

سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين

مدعوم بواسطة MailChimp

HyperAI

استخدم مجموعة البيانات هذه ناقش على Discord

التاريخ

منذ 3 أشهر

المؤسسة

الترخيص

CC BY 4.0

الوسوم

Google

لغة

التعرف على الصوت

حقول البيانات:

utt_id: سلسلة نصية تمثل معرفًا فريدًا للتسجيل.
شكل الموجة: نوع الصوت، معدل أخذ العينات 16000.
locale: سلسلة نصية تمثل منطقة التسجيل.
speaker_id: سلسلة نصية تمثل معرفًا فريدًا للمتحدث.
عمر المتحدث: عدد صحيح مكون من 32 بت يمثل عمر المتحدث.
جنس المتحدث: سلسلة نصية تمثل جنس المتحدث.
البيئة: سلسلة نصية تمثل بيئة التسجيل.
النص: نوع سلسلة نصية يمثل محتوى النص المسجل.
topk_salient_terms: قائمة من السلاسل النصية التي تمثل الكلمات الرئيسية.
topk_salient_terms_timestamps: قائمة من الأرقام العشرية التي تمثل الطوابع الزمنية للكلمات الرئيسية.

مجموعة بيانات MDPBench المعيارية لتحليل المستندات متعددة اللغات

منذ 22 أيام

مجموعة بيانات الكشف عن البريد الإلكتروني العشوائي

منذ 3 أشهر

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا

سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين

مدعوم بواسطة MailChimp

Command Palette

مجموعة بيانات أسئلة الصوت البسيطة

حقول البيانات:

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

مجموعة بيانات أسئلة الصوت البسيطة

حقول البيانات:

مجموعة بيانات MDPBench المعيارية لتحليل المستندات متعددة اللغات

مجموعة بيانات الكشف عن البريد الإلكتروني العشوائي

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

مجموعة بيانات أسئلة الصوت البسيطة

حقول البيانات:

مجموعة بيانات MDPBench المعيارية لتحليل المستندات متعددة اللغات

مجموعة بيانات الكشف عن البريد الإلكتروني العشوائي

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

مجموعة بيانات MDPBench المعيارية لتحليل المستندات متعددة اللغات

مجموعة بيانات الكشف عن البريد الإلكتروني العشوائي

مجموعة بيانات MDPBench المعيارية لتحليل المستندات متعددة اللغات

مجموعة بيانات الكشف عن البريد الإلكتروني العشوائي