HyperAI

مجموعة بيانات النصوص الاصطناعية الهندية Updesh

التاريخ

منذ 9 أيام

الحجم

16.09 GB

المؤسسة

مايكروسوفت

رابط النشر

huggingface.co

Updesh هي مجموعة بيانات نصية اصطناعية باللغة الهندية أصدرتها Microsoft في عام 2025 لتسهيل التدريب اللاحق لنماذج اللغة الكبيرة (LLMs) للغات الهندية.

تحتوي مجموعة البيانات على 6,800,000 من بيانات الاستدلال و2,100,000 من البيانات المولدة باللغات التالية: الآسامية والبنغالية والغوجاراتية والهندية والكانادا والمالايالامية والمراثية والنيبالية والأودية والبنجابية والتاميلية والتيلجو والأردية.

Updesh_beta.torrent
البذر 1التنزيل 0مكتمل 6إجمالي التنزيلات 7
  • Updesh_beta/
    • README.md
      1.2 KB
    • README.txt
      2.4 KB
      • data/
        • Updesh_beta.zip
          16.09 GB