استخدم مجموعة البيانات هذه ناقش على Discord

التاريخ

منذ 7 أشهر

المؤسسة

رابط الورقة البحثية

2509.18004

الترخيص

Apache 2.0

الوسوم

Text-to-Speech

تدريب النموذج

WenetSpeech-Chuan هي مجموعة بيانات واسعة النطاق للهجة سيتشوان-تشونغتشينغ، تم إصدارها عام 2025 من قبل جامعة نورث وسترن بوليتكنيكال بالتعاون مع هيلبيك، ومعهد أبحاث الذكاء الاصطناعي التابع لشركة تشاينا تيليكوم، ومؤسسات أخرى. الورقة البحثية ذات الصلة بعنوان "WenetSpeech-Chuan: مجموعة بيانات واسعة النطاق للغة السيشوانية مع شروح غنية لمعالجة الكلام اللهجي". تحتوي هذه المجموعة من البيانات على 10,013 ساعة من الكلام الأصيل بلهجتي سيتشوان وتشونغتشينغ، منها 3,714 ساعة من البيانات المصنفة بدقة عالية و6,299 ساعة من البيانات المصنفة بشكل أقل دقة. تغطي البيانات تسعة سيناريوهات واقعية، حيث تمثل مقاطع الفيديو القصيرة 52,831 ساعة، بينما تشمل البيانات المتبقية الترفيه، والبث المباشر، والكتب الصوتية، والأفلام الوثائقية، والمقابلات، والأخبار، والقراءة، والمسلسلات التلفزيونية، مما يوفر توزيعًا متنوعًا وواقعيًا للكلام. يُرفق كل كلام بمعلومات تعريفية غنية، مثل محتوى النص، ومستوى الثقة، ودرجة جودة الصوت، وجنس المتحدث وعمره، وعلامات المشاعر.

تم المساهمة بهذه المجموعة من البيانات من قبل مستخدمي المجتمع وهي مخصصة للأغراض التعليمية والإعلامية فقط. إذا كان أي محتوى ينطوي على انتهاك لحقوق النشر، يرجى الاتصال بنا على [email protected] للمراجعة والإزالة الفورية.

مجموعات البيانات ذات الصلة

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار