HyperAIHyperAI

Command Palette

Search for a command to run...

التدريب المسبق للنماذج اللغوية باستخدام التصنيف الخفي النادر

Liliang Ren Zixuan Zhang Han Wang Clare R. Voss Chengxiang Zhai Heng Ji

الملخص

لقد حققت النماذج اللغوية المُدرَّبة مسبقًا كبيرة الحجم الحديثة نجاحًا كبيرًا في مجموعة واسعة من المهام اللاحقة. ومع ذلك، فإن معظم أهداف التدريب المسبق للنماذج اللغوية تركز فقط على إعادة بناء النص، دون السعي لتعلم تمثيلات خفية قابلة للتفسير على مستوى الجملة. في هذه الورقة، نسعى إلى تمكين النماذج اللغوية من فهم أعمق للجمل من خلال اقتراح هدف تدريب مسبق جديد يُسمى "التصنيف الخفي النادر" (Sparse Latent Typing)، والذي يمكّن النموذج من استخراج كلمات مفتاحية على مستوى الجملة بشكل نادر وبنوعيات خفية متنوعة. تُظهر النتائج التجريبية أن نموذجنا قادر على تعلم فئات خفية قابلة للتفسير بطريقة ذاتية التعلم دون استخدام أي معرفة خارجية. علاوةً على ذلك، فإن النموذج اللغوي المُدرَّب مسبقًا باستخدام هذا الهدف يُحسّن بشكل ملحوظ المهام اللاحقة المرتبطة باستخراج المعلومات، سواء في البيئات المُشرَّفة أو في سياقات التعلم القليل (few-shot). يمكن الوصول إلى الكود الخاص بنا بشكل عام عبر الرابط التالي: https://github.com/renll/SparseLT.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
التدريب المسبق للنماذج اللغوية باستخدام التصنيف الخفي النادر | مستندات | HyperAI