مجموعة بيانات النصوص الاصطناعية الهندية Updesh
التاريخ
منذ 9 أيام
الحجم
16.09 GB
رابط النشر
العلامات
الفئات
Updesh هي مجموعة بيانات نصية اصطناعية باللغة الهندية أصدرتها Microsoft في عام 2025 لتسهيل التدريب اللاحق لنماذج اللغة الكبيرة (LLMs) للغات الهندية.
تحتوي مجموعة البيانات على 6,800,000 من بيانات الاستدلال و2,100,000 من البيانات المولدة باللغات التالية: الآسامية والبنغالية والغوجاراتية والهندية والكانادا والمالايالامية والمراثية والنيبالية والأودية والبنجابية والتاميلية والتيلجو والأردية.
Updesh_beta.torrent
البذر 1التنزيل 0مكتمل 6إجمالي التنزيلات 7