HyperAIHyperAI

Command Palette

Search for a command to run...

Console

مجموعة بيانات المحادثة الصينية للأطفال من ChildMandarin

التاريخ

منذ 7 أشهر

الحجم

3.4 GB

المؤسسة

معهد بكين تشي يوان لأبحاث الذكاء الاصطناعي

عنوان URL للنشر

github.com

رابط الورقة

arxiv.org

مجموعة بيانات ChildMandarin هي مجموعة بيانات شاملة للكلام الماندرين للأطفال الذين تتراوح أعمارهم بين 3 إلى 5 سنوات، تم إصدارها في عام 2025 من قبل معهد أبحاث الذكاء الاصطناعي ومختبر تكنولوجيا اللغة البشرية (مختبر HLT) في كلية علوم الكمبيوتر بجامعة نانكاي. تم تصميم مجموعة البيانات هذه لحل مشكلة ندرة بيانات خطاب الماندرين لهذه الفئة العمرية. نتائج الورقة ذات الصلة هي:ChildMandarin: مجموعة بيانات شاملة عن لغة الماندرين للأطفال الصغار الذين تتراوح أعمارهم بين 3 و5 سنوات"، والذي يهدف إلى دعم تطوير مجالات البحث ذات الصلة مثل التعرف على كلام الأطفال والتحقق من المتحدث.

ميزات مجموعة البيانات:

  • حجم بيانات كبير: 397 طفلاً، بإجمالي 41.25 ساعة من المحادثة بين 3-5 سنوات، وهو ما له مزايا معينة بين مجموعات البيانات المماثلة
  • تغطية جغرافية واسعة: يتم جمع البيانات من 22 مقاطعة ومدينة، مما يضمن التنوع الإقليمي وتغطية اللهجات المختلفة وعادات الكلام
  • التفاعل الطبيعي والواقعي: يتم اعتماد طريقة جمع الحوار الموجه من قبل الوالدين لمحاكاة مشاهد الاتصال الطبيعية وجعل الصوت أكثر واقعية.

ChildMandarin.torrent
البذر 1جارٍ التنزيل 0مكتمل 88إجمالي التنزيلات 262
  • ChildMandarin/
    • README.md
      1.64 KB
    • README.txt
      3.27 KB
      • data/
        • ChildMandarin.zip
          3.4 GB

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية بالذكاء الاصطناعي
وحدات معالجة الرسوميات الجاهزة للاستخدام
أفضل تسعير

Hyper Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp