HyperAIHyperAI

Command Palette

Search for a command to run...

منذ 2 أشهر

مُسرِّع استخلاص النموذج اللغوي لفك تشفير الكتل المُجمَّعة

Itai Gat Heli Ben-Hamu Marton Havasi Daniel Haziza Jeremy Reizenstein Gabriel Synnaeve David Lopez-Paz Brian Karrer Yaron Lipman

مُسرِّع استخلاص النموذج اللغوي لفك تشفير الكتل المُجمَّعة

الملخص

تقدم نماذج لغة التنبؤ بالرمز التالي القائم على النمذجة التلقائية (Autoregressive) قدرات قوية، لكنها تواجه تحديات كبيرة في التطبيق العملي نظرًا للتكاليف الحسابية والذاكرة العالية الناتجة عن عملية الاستنتاج، خاصة أثناء مرحلة التفكيك (decoding). نقدّم طريقة "تفكيك الكتلة المحددة" (Set Block Decoding - SBD)، وهي نموذج بسيط ومرن يُسرّع عملية التوليد من خلال دمج التنبؤ القياسي بالرمز التالي (Next Token Prediction - NTP) والتنبؤ بالرمز المُغطى (Masked Autoregressive Token Prediction - MATP) داخل هيكل معماري واحد. تتيح SBD للنموذج عينة عدة رموز مستقبلية في آن واحد، وليس بالضرورة متتالية، وهو ما يُميّزها عن الطرق السابقة للتسريع. وتتيح هذه المرونة استخدام حلّال متقدمة مستمدة من أدبيات التمايز المتقطع (discrete diffusion)، مما يُحقق تسريعًا كبيرًا دون التضحية بالدقة. ولا تتطلب SBD أي تغييرات في البنية المعمارية أو معلمات تدريب إضافية، وتحتفظ بالتوافق مع تقنية التخزين الدقيق لذاكرة القيم (KV-caching)، ويمكن تنفيذها عبر تدريب دقيق (fine-tuning) لنماذج التنبؤ بالرمز التالي الحالية. وباستخدام تدريب دقيق لنموذج Llama-3.1 8B ونموذج Qwen-3 8B، نُظهر أن SBD تُقلّل من عدد التمريرات الأمامية (forward passes) المطلوبة للتوليد بنسبة 3 إلى 5 أضعاف، مع الحفاظ على الأداء نفسه مقارنةً بالتدريب التقليدي بنموذج NTP.

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة المشتركة بالذكاء الاصطناعي
وحدات معالجة رسومات جاهزة
أفضل الأسعار
ابدأ الآن

Hyper Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
مُسرِّع استخلاص النموذج اللغوي لفك تشفير الكتل المُجمَّعة | الأوراق البحثية | HyperAI