CloudEval-YAML: معيار عملي لتوليد التهيئة السحابية

في ظل النمو المتسارع لنظم الحوسبة السحابية وازدياد انتشار أدوات توليد الشفرة المستندة إلى نماذج اللغة الكبيرة (LLM)، يوجد نقص في وجود معايير تقييم معيارية لتوليد الشفرة في التطبيقات السحابية المبنية على المعمارية الحديثة. وردًا على هذه الحاجة، نقدم "CloudEval-YAML"، وهي معيار عملي لتوليد تهيئة السحابة. يتعامل CloudEval-YAML مع تحدي التنوّع من خلال التركيز على تنسيق YAML، الذي يُعد المعيار الفعلي لعدد كبير من أدوات التطبيقات السحابية الحديثة. وقد تم تطوير معيار CloudEval-YAML مع التركيز على الجدوى العملية: حيث يتكوّن المجموعة من مسائل مكتوبة يدويًا، تشمل اختبارات وحدات تستهدف سيناريوهات عملية. وتم تعزيز هذه المجموعة لتلبية الاحتياجات العملية من خلال إعادة صياغة الأسئلة بشكل موجز ومقتضب ومتعدد اللغات. وتضم المجموعة 1011 مسألة، استغرقت أكثر من 1200 ساعة عمل بشري لإكمالها. ولتحسين الجدوى العملية أثناء التقييم، تم بناء منصة تقييم قابلة للتوسع لـ CloudEval-YAML، والتي حققت تسريعًا بنسبة 20 مرة مقارنةً بجهاز واحد. إلى حد معرفتنا، تمثل مجموعة بيانات CloudEval-YAML أول مجموعة بيانات مكتوبة يدويًا تستهدف التطبيقات السحابية الحديثة. ونقدّم تقييمًا متعمقًا لـ 12 نموذجًا لغويًا كبيرًا، مما يُسهم في فهم أعمق للمشكلات والنموذج، فضلًا عن تطوير أساليب فعّالة لتحسين الأداء وخفض التكاليف.