HyperAIHyperAI

Command Palette

Search for a command to run...

مجموعة بيانات التعرف على الكلام والترجمة الأوروبية من Granary

التاريخ

منذ 3 أشهر

الحجم

50.49 GB

المؤسسة

إنفيديا

رابط الورقة البحثية

2505.13404v2

Granary هي مجموعة بيانات كلامية متعددة اللغات واسعة النطاق أصدرها فريق البحث متعدد المواقع التابع لشركة NVIDIA في عام 2025. نتائج الورقة ذات الصلة هي "المخزن: مجموعة بيانات التعرف على الكلام والترجمة في 25 لغة أوروبية"، والذي يهدف إلى توفير مواد تدريبية وتقييمية عالية الجودة لنماذج التعرف التلقائي على الكلام/التعرف على الكلام متعددة اللغات.

تحتوي هذه المجموعة من البيانات على ما يقارب مليون ساعة من بيانات الكلام عالية الجودة بتقنية التعرف التلقائي على الكلام (ASR) ذات التصنيفات شبه المُصنّفة، والتي تغطي 25 لغة أوروبية (بما في ذلك 23 لغة من لغات الاتحاد الأوروبي، بالإضافة إلى اللغتين الأوكرانية والروسية). تُستمد هذه البيانات من مجموعات كلامية متاحة للعامة، وتُعالَج من خلال عملية موحدة للتصنيفات شبه المُصنّفة وتصفية الجودة.

تشمل اللغات:

البلغارية، التشيكية، الدنماركية، الألمانية، اليونانية، الإنجليزية، الإسبانية، الإستونية، الفنلندية، الفرنسية، الكرواتية، المجرية، الإيطالية، الليتوانية، اللاتفية، المالطية، الهولندية، البولندية، البرتغالية، الرومانية، السلوفاكية، السلوفينية، السويدية، الأوكرانية والروسية.

Granary.torrent
البذر 1التنزيل 0مكتمل 12إجمالي التنزيلات 35
  • Granary/
    • README.md
      1.66 KB
    • README.txt
      3.31 KB
      • data/
        • Granary.zip
          50.49 GB

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة المشتركة بالذكاء الاصطناعي
وحدات معالجة رسومات جاهزة
أفضل الأسعار
ابدأ الآن

Hyper Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp