HyperAIHyperAI

Command Palette

Search for a command to run...

منذ شهر واحد

LongCodeZip: ضغط السياق الطويل للنماذج اللغوية للبرمجة

Yuling Shi Yichun Qian Hongyu Zhang Beijun Shen Xiaodong Gu

LongCodeZip: ضغط السياق الطويل للنماذج اللغوية للبرمجة

الملخص

يُعدّ توليد الكود في ظل سياقات طويلة أمرًا بالغ الأهمية بشكل متزايد، مع تزايد الحاجة إلى قدرة النماذج اللغوية الكبيرة (LLMs) على التفكير في كمّ كبير من المعلومات ضمن قواعد الكود. وعلى الرغم من التطورات الحديثة التي تتيح لنماذج الكود القائمة على النماذج اللغوية الكبيرة معالجة المدخلات الطويلة، تظل تكاليف واجهات برمجة التطبيقات (API) العالية وتأخير التوليد عوائق كبيرة. ورغم أن تقنيات استخلاص السياق الحالية، مثل LLMLingua، حققت نتائج واعدة في النصوص العامة، إلا أنها تتجاهل الهياكل والاعتماديات المميزة للكود، ما يؤدي إلى أداء غير مثالي في المهام البرمجية. في هذه الورقة، نُقدّم LongCodeZip، وهي إطار جديد قابل للتركيب مباشرة (plug-and-play) لضغط الكود مصمم خصيصًا لنماذج الكود القائمة على النماذج اللغوية الكبيرة. يعتمد LongCodeZip على استراتيجية مزدوجة المراحل: (1) ضغط خشن، يُحدد من خلاله كتلًا على مستوى الدوال ويُصنّفها بناءً على التشتت الشرطي بالنسبة للتعليمات، ويُحتفظ فقط بالدوال الأكثر صلة؛ و(2) ضغط دقيق، يُقسّم الدوال المحفوظة إلى كتل بناءً على التشتت، ويختار مجموعة فرعية مثلى ضمن ميزانية مخصصة للرموز (token budget) تكيفية، بهدف تعظيم الصلة. أظهرت التقييمات عبر مهام متعددة، بما في ذلك إكمال الكود، وتلخيصه، والإجابة على الأسئلة، أن LongCodeZip تتفوّق بشكل متسق على الطرق الأساسية، مع تحقيق نسبة ضغط تصل إلى 5.6 مرة دون تدهور في أداء المهمة. وبفضل قدرته الفعّالة على تقليل حجم السياق مع الحفاظ على المعلومات الأساسية، يمكّن LongCodeZip النماذج اللغوية الكبيرة من التوسع بشكل أفضل في السيناريوهات الواقعية الكبيرة النطاق، مما يُسهم في تعزيز كفاءة وقابلية تطبيقات الذكاء البرمجي.

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة المشتركة بالذكاء الاصطناعي
وحدات معالجة رسومات جاهزة
أفضل الأسعار
ابدأ الآن

Hyper Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
LongCodeZip: ضغط السياق الطويل للنماذج اللغوية للبرمجة | الأوراق البحثية | HyperAI