Search for a command to run...
هل يمكن للنماذج اللغوية الكبيرة توليد حالات اختبار عالية الجودة للمشاكل الخوارزمية؟ TestCase-Eval: تقييم منهجي لتغطية الأخطاء وكشفها