منذ 6 أشهر

الملخص

لقد حققت النماذج اللغوية المُدرَّبة مسبقًا كبيرة الحجم الحديثة نجاحًا كبيرًا في مجموعة واسعة من المهام اللاحقة. ومع ذلك، فإن معظم أهداف التدريب المسبق للنماذج اللغوية تركز فقط على إعادة بناء النص، دون السعي لتعلم تمثيلات خفية قابلة للتفسير على مستوى الجملة. في هذه الورقة، نسعى إلى تمكين النماذج اللغوية من فهم أعمق للجمل من خلال اقتراح هدف تدريب مسبق جديد يُسمى "التصنيف الخفي النادر" (Sparse Latent Typing)، والذي يمكّن النموذج من استخراج كلمات مفتاحية على مستوى الجملة بشكل نادر وبنوعيات خفية متنوعة. تُظهر النتائج التجريبية أن نموذجنا قادر على تعلم فئات خفية قابلة للتفسير بطريقة ذاتية التعلم دون استخدام أي معرفة خارجية. علاوةً على ذلك، فإن النموذج اللغوي المُدرَّب مسبقًا باستخدام هذا الهدف يُحسّن بشكل ملحوظ المهام اللاحقة المرتبطة باستخراج المعلومات، سواء في البيئات المُشرَّفة أو في سياقات التعلم القليل (few-shot). يمكن الوصول إلى الكود الخاص بنا بشكل عام عبر الرابط التالي: https://github.com/renll/SparseLT.

ملف PDF المصدر

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا

سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين

مدعوم بواسطة MailChimp

الملخص

Liliang Ren Zixuan Zhang Han Wang Clare R. Voss Chengxiang Zhai Heng Ji

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Liliang Ren Zixuan Zhang Han Wang Clare R. Voss Chengxiang Zhai Heng Ji

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Liliang Ren Zixuan Zhang Han Wang Clare R. Voss Chengxiang Zhai Heng Ji

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

التدريب المسبق للنماذج اللغوية باستخدام التصنيف الخفي النادر

Liliang Ren Zixuan Zhang Han Wang Clare R. Voss Chengxiang Zhai Heng Ji

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

التدريب المسبق للنماذج اللغوية باستخدام التصنيف الخفي النادر

Liliang Ren Zixuan Zhang Han Wang Clare R. Voss Chengxiang Zhai Heng Ji

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

التدريب المسبق للنماذج اللغوية باستخدام التصنيف الخفي النادر

Liliang Ren Zixuan Zhang Han Wang Clare R. Voss Chengxiang Zhai Heng Ji

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters