منذ 2 أشهر
MSc-SQL: نقد نماذج اللغة الصغيرة متعددة العينات لتحويل النص إلى SQL
Gorti, Satya Krishna ; Gofman, Ilan ; Liu, Zhaoyan ; Wu, Jiapeng ; Vouitsis, Noël ; Yu, Guangwei ; Cresswell, Jesse C. ; Hosseinzadeh, Rasa

الملخص
توليد النص إلى SQL يمكّن غير الخبراء من التفاعل مع قواعد البيانات عبر اللغة الطبيعية. الابتكارات الحديثة تعتمد على نماذج مغلقة المصدر كبيرة مثل GPT-4، والتي تواجه تحديات في الوصول والخصوصية والتلكؤ. لمعالجة هذه القضايا، نركز على تطوير نماذج النص إلى SQL صغيرة وكفاءة ومفتوحة المصدر. نوضح فوائد أخذ عينات من عدة مرشحات لتوليد SQL ونقترح طريقة لدينا، MSc-SQL، لانتقادها باستخدام البيانات الوصفية المرتبطة. نموذجنا لانتقاد العينات يقوم بتقييم عدة مخرجات في آن واحد، مما يحقق أداءً رائدًا مقارنة بباقي النماذج المفتوحة المصدر بينما يبقى تنافسيًا مع النماذج الأكبر بكثير وبتكلفة أقل بكثير. يمكن العثور على الكود الكامل في https://github.com/layer6ai-labs/msc-sql.