HyperAIHyperAI

Command Palette

Search for a command to run...

مجموعة بيانات التعرف على الكلام والترجمة الأوروبية من Granary

التاريخ

منذ 6 أشهر

الحجم

50.49 GB

المؤسسة

إنفيديا

رابط الورقة البحثية

2505.13404v2

Granary هي مجموعة بيانات كلامية متعددة اللغات واسعة النطاق أصدرها فريق البحث متعدد المواقع التابع لشركة NVIDIA في عام 2025. نتائج الورقة ذات الصلة هي "المخزن: مجموعة بيانات التعرف على الكلام والترجمة في 25 لغة أوروبية"، والذي يهدف إلى توفير مواد تدريبية وتقييمية عالية الجودة لنماذج التعرف التلقائي على الكلام/التعرف على الكلام متعددة اللغات.

تحتوي هذه المجموعة من البيانات على ما يقارب مليون ساعة من بيانات الكلام عالية الجودة بتقنية التعرف التلقائي على الكلام (ASR) ذات التصنيفات شبه المُصنّفة، والتي تغطي 25 لغة أوروبية (بما في ذلك 23 لغة من لغات الاتحاد الأوروبي، بالإضافة إلى اللغتين الأوكرانية والروسية). تُستمد هذه البيانات من مجموعات كلامية متاحة للعامة، وتُعالَج من خلال عملية موحدة للتصنيفات شبه المُصنّفة وتصفية الجودة.

تشمل اللغات:

البلغارية، التشيكية، الدنماركية، الألمانية، اليونانية، الإنجليزية، الإسبانية، الإستونية، الفنلندية، الفرنسية، الكرواتية، المجرية، الإيطالية، الليتوانية، اللاتفية، المالطية، الهولندية، البولندية، البرتغالية، الرومانية، السلوفاكية، السلوفينية، السويدية، الأوكرانية والروسية.

Granary.torrent
البذر 1جارٍ التنزيل 0مكتمل 54إجمالي التنزيلات 79
  • Granary/
    • README.md
      1.66 KB
    • README.txt
      3.31 KB
      • data/
        • Granary.zip
          50.49 GB

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp