HyperAIHyperAI

Command Palette

Search for a command to run...

منذ شهر واحد

كودا: تشفير نموذج اللغة من خلال التكيّف بالانتشار

كودا: تشفير نموذج اللغة من خلال التكيّف بالانتشار

الملخص

تُعد نماذج اللغة القائمة على الانتشار (Diffusion language models) واعدةً بتمكين السياق ثنائي الاتجاه وقدرات تعبئة الفجوات، وهي ميزات تفتقدها النماذج المتسلسلة (autoregressive coders)، ومع ذلك تظل الأنظمة العملية ثقيلة النسق. نقدّم "CoDA"، وهو نموذج انتشار بحجم 1.7 مليار معامل، تم تدريبه على وحدات TPU باستخدام مسار تدريب مفتوح المصدر بالكامل. يدمج CoDA بين التدريب المسبق على نطاق واسع باستخدام الانتشار، والتكييف المركّز حول الكود خلال عملية التدريب، والتكييف بالتعليمات، مما يتيح عينات مدعومة بالثقة، ويحافظ على زمن الاستجابة أثناء الاستدلال على مستوى تنافسي. وقد أظهرت النسخة CoDA-1.7B-Instruct أداءً مُنافسًا أو تفوقت على نماذج الانتشار ذات الحجم حتى 7 مليار معامل في مجموعات تقييم Humaneval وMBPP وEvalPlus. يشمل إصدارنا إتاحة نقاط التحقق (checkpoints) للنموذج، وأدوات التقييم، ومسارات تدريب على وحدات TPU، بهدف تسريع الأبحاث المتعلقة بمساعدات البرمجة القائمة على الانتشار وذات الحجم الخفيف.

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة المشتركة بالذكاء الاصطناعي
وحدات معالجة رسومات جاهزة
أفضل الأسعار
ابدأ الآن

Hyper Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
كودا: تشفير نموذج اللغة من خلال التكيّف بالانتشار | الأوراق البحثية | HyperAI