HyperAIHyperAI

Command Palette

Search for a command to run...

تعلم تمثيل الشفرة المقارن

Paras Jain* Ajay Jain* Tianjun Zhang Pieter Abbeel Joseph E. Gonzalez Ion Stoica

الملخص

العمل الحديث يتعلم التمثيلات السياقية للكود المصدر من خلال إعادة بناء الرموز من سياقها. بالنسبة للمهام ذات الصلة بالفهم الدلالي مثل تلخيص الكود باللغة الإنجليزية، يجب أن تلتقط هذه التمثيلات وظائف البرنامج بشكل مثالي. ومع ذلك، نوضح أن النموذج الشائع القائم على إعادة البناء BERT حساس للتعديلات في الكود المصدر، حتى عندما تحافظ هذه التعديلات على المعنى الدلالي. نقترح ContraCode (كونتراكود): مهمة تعليم مسبق تضادية تتعلم وظائف الكود وليس شكله. يقوم ContraCode بتعليم شبكة عصبية مسبقة لتحديد المتغيرات الوظيفية المتشابهة لبرنامج بين العديد من المقاطع غير المكافئة. نولد هذه المتغيرات بشكل قابل للتوسع باستخدام مترجم مصدر إلى مصدر آلي كشكل من أشكال زيادة البيانات. يحسن التعليم المسبق التضادي دقة تلخيص JavaScript ودقة استدلال الأنواع في TypeScript بنسبة تتراوح بين 2% و13%. كما نقترح مجموعة بيانات جديدة لا تحتوي على أي أمثلة سابقة للكشف عن النسخ المكررة للكود JavaScript، مما يظهر أن ContraCode أكثر صلابة ومعنى دلالياً. في هذا الإطار، نتفوق على RoBERTa بنسبة 39% في مؤشر AUROC في بيئة معادية، وفي حدود 5% على الكود الطبيعي.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp