HyperAIHyperAI

Command Palette

Search for a command to run...

قاعدة بيانات خطابات المؤتمرات الصينية متعددة القنوات AISHELL-4

التاريخ

منذ 2 أعوام

الحجم

48.38 GB

المؤسسة

أيشيل

عنوان URL للنشر

www.aishelltech.com

AISHELL-4 عبارة عن مجموعة بيانات واسعة النطاق من الكلام المندرين الحقيقي المسجل تم جمعها بواسطة مجموعة ميكروفون دائرية مكونة من 8 قنوات لمعالجة الكلام في سيناريوهات المؤتمرات.تتكون مجموعة البيانات من 211 جلسة مؤتمر مسجلة، تحتوي كل منها على 4 إلى 8 متحدثين، بإجمالي مدة 120 ساعة.تهدف مجموعة البيانات هذه إلى الجمع بين الأبحاث المتقدمة وسيناريوهات التطبيق العملي لمعالجة متعددة المتحدثين من ثلاثة جوانب. باستخدام المؤتمرات المسجلة الحقيقية، يوفر AISHELL-4 تأثيرات صوتية واقعية وميزات كلامية طبيعية غنية في المحادثات، مثل التوقفات القصيرة، وتداخل الكلام، والانعطافات السريعة للمتحدث، والضوضاء، وما إلى ذلك. وفي الوقت نفسه، يتم توفير النسخ الدقيق ونشاط صوت المتحدث لكل اجتماع في AISHELL. وهذا يسمح للباحثين باستكشاف جوانب مختلفة من معالجة المؤتمرات، من المهام الفردية مثل معالجة واجهة الكلام، والتعرف على الكلام، وتدوين المتحدث، إلى النمذجة المتعددة الوسائط والتحسين المشترك للمهام ذات الصلة. كما أصدر فريق البحث أيضًا إطار عمل للتدريب والتقييم يعتمد على PyTorch كنظام أساسي لتعزيز البحث القابل للتكرار في هذا المجال.

AISHELL-4.torrent
البذر 1جارٍ التنزيل 0مكتمل 283إجمالي التنزيلات 605
  • AISHELL-4/
    • README.md
      1.68 KB
    • README.txt
      3.36 KB
      • data/
        • AISHELL-4.zip
          48.38 GB

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp