HyperAIHyperAI

Command Palette

Search for a command to run...

استكشاف حدود نماذج اللغة

Rafal Jozefowicz; Oriol Vinyals; Mike Schuster; Noam Shazeer; Yonghui Wu

الملخص

في هذا العمل، نستكشف التقدم الحديث في شبكات العصبونات المتكررة لنموذج اللغة على نطاق واسع، وهي مهمة أساسية لفهم اللغة. نوسع النماذج الحالية للتعامل مع تحديين رئيسيين موجودين في هذه المهمة: أحجام المكتبات اللغوية والقواميس، والهيكل المعقد للمدى الطويل للغة. نقوم بدراسة شاملة على تقنيات مثل شبكات العصبونات الشبكية القائمة على الحروف أو الذاكرة طويلة الأمد قصيرة الأمد (Long-Short Term Memory)، باستخدام معيار مليار كلمة. أفضل نموذج لدينا يحسن بشكل كبير من أحدث نسبة التحير (perplexity) من 51.3 إلى 30.0 (مع تقليل عدد المعلمات بمقدار عشرين ضعفًا)، بينما تحدد مجموعة من النماذج رقماً قياسياً جديداً بتحسين نسبة التحير من 41.0 إلى 23.7. كما نوفر هذه النماذج للمجتمع العلمي في معالجة اللغة الطبيعية والتعلم الآلي لدراستها وتحسينها.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
استكشاف حدود نماذج اللغة | مستندات | HyperAI