HyperAIHyperAI

Command Palette

Search for a command to run...

N-Grammer: تعزيز المحولات بمقاييس n-gram المخفية

الملخص

أصبحت نماذج المُحَوِّل (Transformer) في الآونة الأخيرة واحدة من النماذج الأساسية في معالجة اللغة الطبيعية، وبما ينجم عن ذلك، تزايد الاهتمام والاستثمار الكبير في توسيع حجم هذه النماذج. ومع ذلك، فإن تكاليف التدريب والاستنتاج الخاصة بنماذج اللغة الكبيرة من نوع المُحَوِّل تكون مرتفعة جدًا، مما يستدعي مزيدًا من البحث في تحديد نماذج أكثر كفاءة. في هذا العمل، نقترح تعديلًا بسيطًا ولكن فعّالًا على بنية المُحَوِّل، مستلهمين من الأدبيات المتعلقة بنمذجة اللغة الإحصائية، من خلال إضافة n-gram إلى النموذج تم بناؤه من تمثيل خفي منفصل للسلسلة النصية. قمنا بتقييم نموذجنا، المُسمى N-Grammer، على مهمة نمذجة اللغة باستخدام مجموعة بيانات C4، وكذلك على تصنيف النصوص باستخدام مجموعة بيانات SuperGLUE، ووجدنا أنه يتفوق على عدة نماذج قوية مثل المُحَوِّل (Transformer) وPrimer. ونتيجة لذلك، نُشر النموذج مفتوح المصدر لغرض إعادة الإنتاج، باستخدام إطار Jax.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp