HyperAIHyperAI
منذ 2 أشهر

معاينة لـ XiYan-SQL: إطار متعدد المولدات للتحويل من النص إلى SQL

Gao, Yingqi ; Liu, Yifu ; Li, Xiaoxia ; Shi, Xiaorong ; Zhu, Yin ; Wang, Yiming ; Li, Shiqi ; Li, Wei ; Hong, Yuntao ; Luo, Zhiling ; Gao, Jinyang ; Mou, Liyu ; Li, Yu
معاينة لـ XiYan-SQL: إطار متعدد المولدات للتحويل من النص إلى SQL
الملخص

للتغلب على تحديات أداء نماذج اللغة الكبيرة في مهام التحويل من اللغة الطبيعية إلى SQL، نقدم إطار العمل المبتكر XiYan-SQL، الذي يستخدم استراتيجية تجميع متعددة المولدات لتحسين إنشاء المرشحين. نقدم أيضًا M-Schema، وهي طريقة تمثيل شبه هيكلية مصممة لتعزيز فهم بنية قواعد البيانات. لتعزيز جودة ومتنوعة الاستعلامات SQL المولدة، يدمج XiYan-SQL الإمكانات الهامة للتعلم السياقي (ICL) مع السيطرة الدقيقة على التحسين الإشرافي. من ناحية أخرى، نقترح سلسلة من استراتيجيات التدريب لتحسين النماذج لإنشاء مرشحين ذوي جودة عالية ومتنوعة التفضيلات. ومن ناحية أخرى، نقوم بتنفيذ نهج التعلم السياقي باستخدام طريقة اختيار الأمثلة المستندة إلى التعرف على الكيانات المعروفة لمنع التركيز الزائد على الكيانات. يقوم المحسن بتحسين كل مرشح عن طريق تصحيح الأخطاء المنطقية أو النحوية. للتعامل مع تحدي تحديد أفضل مرشح، نقوم بتحسين نموذج الاختيار لتمييز الفروق الدقيقة بين الاستعلامات SQL المرشحة. تظهر النتائج التجريبية على عدة مجموعات بيانات باللهجات المختلفة قوة XiYan-SQL في التعامل مع التحديات في سيناريوهات مختلفة. بشكل عام، يحقق الإطار المقترح XiYan-SQL دقة تنفيذ رائدة في مجالها تبلغ 75.63٪ على مقاييس Bird و89.65٪ على مجموعة اختبار Spider و69.86٪ على SQL-Eval و41.20٪ على NL2GQL. لا يقتصر الإطار المقترح على تعزيز جودة ومتنوعة استعلامات SQL فحسب، بل يتفوق أيضًا على الطرق السابقة.

معاينة لـ XiYan-SQL: إطار متعدد المولدات للتحويل من النص إلى SQL | أحدث الأوراق البحثية | HyperAI