HyperAIHyperAI

Command Palette

Search for a command to run...

جزئيًا ترتيب بيانات التدريب لتحسين نماذج اللغة

Ofir Press

الملخص

رغم أن خوارزمية التدرج العكسي العشوائي (SGD) تتطلب ترتيب البيانات التدريبية بشكل عشوائي بين الدورات، إلا أنه في الوقت الحالي لا تقوم أي من أنظمة النمذجة اللغوية على مستوى الكلمات بذلك. ترتيب جميع الجمل في البيانات التدريبية بشكل عشوائي بطرق بسيطة لن يسمح للنموذج بتعلم الارتباطات بين الجمل. في هذا البحث، نقدم طريقة تقوم بتوزيع جزئي للبيانات التدريبية بين الدورات. هذه الطريقة تجعل كل دفعة عشوائية مع الحفاظ على معظم ترتيب الجمل. وقد حققت هذه الطريقة نتائج جديدة رائدة في النمذجة اللغوية على مستوى الكلمات لكل من مجموعتي بيانات بنك الأشجار بن وويكيتEXT-2.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
جزئيًا ترتيب بيانات التدريب لتحسين نماذج اللغة | مستندات | HyperAI