منذ 5 أشهر

الملخص

تم اقتراح التنبؤ بعدد متعدد من الرموز (MTP) كهدف مساعد لتحسين التنبؤ بالرمز التالي (NTP) أثناء تدريب النماذج اللغوية، لكنه أظهر تحسينات غير منتظمة، وتفوّق ضعيفًا في معايير تقييم الذكاء الاصطناعي اللغوي القياسية. نحن نرى أن مهمة التنبؤ الدقيق بالرموز المستقبلية في MTP تكون صعبة جدًا كخسارة مساعدة. بدلًا من ذلك، نقترح نموذج التنبؤ بترتيب الرموز (TOP)، الذي يدرّب النماذج على ترتيب الرموز القادمة حسب قربها باستخدام خسارة تعلم الترتيب (learning-to-rank loss). يُعدّ TOP أقل تكلفة من MTP، حيث يتطلب إضافة طبقة واحدة فقط من طبقات "الإلغاء التمثيلي" (unembedding)، مقارنةً بعدة طبقات من نماذج الترانسفورمر التي يتطلبها MTP. قمنا بتدريب نماذج بحجم 340 مليون، و1.8 مليار، و7 مليار معلمة باستخدام الأهداف الثلاثة: NTP وMTP وTOP. أظهرت النتائج على ثمانية معايير قياسية في مجال معالجة اللغة الطبيعية أن TOP يتفوّق بشكل عام على كل من NTP وMTP، حتى عند التوسع في الحجم. يمكن الاطلاع على الكود المصدري عبر الرابط التالي: https://github.com/zaydzuhri/token-order-prediction

ملف PDF المصدر عرض الكود

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا

سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين

مدعوم بواسطة MailChimp

الملخص

Zayd M. K. Zuhri Erland Hilman Fuadi Alham Fikri Aji

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Zayd M. K. Zuhri Erland Hilman Fuadi Alham Fikri Aji

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Zayd M. K. Zuhri Erland Hilman Fuadi Alham Fikri Aji

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

تحسين نمذجة اللغة من خلال توقع ترتيب الرموز القادمة

Zayd M. K. Zuhri Erland Hilman Fuadi Alham Fikri Aji

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

تحسين نمذجة اللغة من خلال توقع ترتيب الرموز القادمة

Zayd M. K. Zuhri Erland Hilman Fuadi Alham Fikri Aji

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

تحسين نمذجة اللغة من خلال توقع ترتيب الرموز القادمة

Zayd M. K. Zuhri Erland Hilman Fuadi Alham Fikri Aji

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters