HyperAIHyperAI

Command Palette

Search for a command to run...

منذ 4 أشهر

استغلال النماذج اللغوية المُدرَّبة مسبقًا لإنشاء الكود

{Mayada Hadhoud Samir Shaheen Ahmed Soliman}

استغلال النماذج اللغوية المُدرَّبة مسبقًا لإنشاء الكود

الملخص

تشير المساعدة في كتابة الكود إلى استخدام مجموعة متنوعة من الأدوات والتقنيات والنموذج لمساعدة المطورين أثناء عملية تطوير البرمجيات. ومع تعقيد مهام البرمجة بشكل متزايد، يلعب مساعد الكود دورًا محوريًا في تعزيز إنتاجية المطورين، وتقليل الأخطاء، وتسهيل سير عملية كتابة الكود بشكل أكثر كفاءة. ويمكن أن تظهر هذه المساعدة بأشكال متعددة، بما في ذلك اكتمال الكود تلقائيًا، وكشف الأخطاء وتصحيحها، وإنشاء الكود، ودعم التوثيق، والتوصيات المعتمدة على السياق. وقد برزت النماذج اللغوية كعناصر أساسية في المساعدة في كتابة الكود، حيث توفر للمطورين القدرة على استقبال اقتراحات ذكية، وإنشاء قطع كود، وتحسين الكفاءة العامة في كتابة الكود. في هذا البحث، نقترح نماذج هجينة جديدة لإنشاء الكود من خلال الاستفادة من النماذج اللغوية المُدرّبة مسبقًا BERT وRoBERTa وELECTRA وLUKE بالتزامن مع نموذج Marian Causal Language Model. وقد تم اختيار هذه النماذج استنادًا إلى أدائها القوي في مهام معالجة اللغة الطبيعية المختلفة. ونقيّم أداء هذه النماذج على مجموعتي بيانات CoNaLa وDJANGO، ونقارنها بالنماذج الحالية ذات المستوى الرائد. ونهدف إلى استكشاف الإمكانات الكامنة في النماذج اللغوية المُدرّبة مسبقًا باستخدام معمارية الترانسفورمر لثورة في إنشاء الكود، مما يوفر دقة وفعالية محسّنة في التعامل مع السيناريوهات البرمجية المعقدة. بالإضافة إلى ذلك، نُجري تحليلًا للأخطاء ونُحسّن الكود المُولَّد. وتُظهر النتائج أن هذه النماذج، عند دمجها مع مُفكّك Marian، تُحسّن بشكل كبير دقة وكفاءة إنشاء الكود. وتمكّنت نموذج RoBERTaMarian من تحقيق أعلى درجة BLEU تبلغ 35.74 ودقة مطابقة دقيقة تبلغ 13.8٪ على مجموعة بيانات CoNaLa، بينما حقق نموذج LUKE-Marian درجة BLEU تبلغ 89.34 ودقة مطابقة دقيقة تبلغ 78.50٪ على مجموعة بيانات DJANGO. يمكن الاطلاع على تنفيذ هذا العمل عبر الرابط التالي: https://github.com/AhmedSSoliman/Leveraging-Pretrained-Language-Models-for-Code-Generation.

المعايير القياسية

معيار قياسيالمنهجيةالمقاييس
code-generation-on-conalaELECTRAMarian
BLEU: 30.18
Exact Match Accuracy: 10.0
code-generation-on-conalaRoBERTaMarian
BLEU: 35.74
Exact Match Accuracy: 13.8
code-generation-on-conalaBERTMarian
BLEU: 32.46
Exact Match Accuracy: 12.40
code-generation-on-conalaLUKEMarian
BLEU: 29.83
Exact Match Accuracy: 7.6
code-generation-on-djangoLUKEMarian
Accuracy: 78.50
BLEU Score: 89.34
code-generation-on-djangoRoBERTaMarian
Accuracy: 77.95
BLEU Score: 88.91
code-generation-on-djangoBERTMarian
Accuracy: 76.68
BLEU Score: 56.55
code-generation-on-djangoELECTRAMarian
Accuracy: 65.32
BLEU Score: 53.02

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة المشتركة بالذكاء الاصطناعي
وحدات معالجة رسومات جاهزة
أفضل الأسعار
ابدأ الآن

Hyper Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
استغلال النماذج اللغوية المُدرَّبة مسبقًا لإنشاء الكود | الأوراق البحثية | HyperAI