HyperAIHyperAI
منذ 4 أشهر

CHESS: الاستخدام السياقي لتحسين توليف SQL بكفاءة

Talaei, Shayan ; Pourreza, Mohammadreza ; Chang, Yu-Chen ; Mirhoseini, Azalia ; Saberi, Amin
CHESS: الاستخدام السياقي لتحسين توليف SQL بكفاءة
الملخص

ترجمة أسئلة اللغة الطبيعية إلى استعلامات SQL، المعروفة باسم ترجمة النص إلى SQL (text-to-SQL)، هي مشكلة بحثية قديمة. يمكن أن تصبح الترجمة الفعالة من النص إلى SQL صعبة للغاية بسبب (i) الحجم الكبير لفهارس قواعد البيانات (Descriptions of tables and their columns) وقيم قاعدة البيانات، (ii) الاستدلال على مخططات قواعد بيانات كبيرة، (iii) ضمان صحة الوظائف للمستعلمات المولدة، و(iv) التعامل مع الغموض في أسئلة اللغة الطبيعية. نقدم نظام CHESS، وهو إطار متعدد الوكلاء يعتمد على نماذج اللغات الكبيرة (LLM) لتحقيق توليد SQL فعال وقابل للتوسع، ويتألف من أربعة وكلاء متخصصين، كل منهم يستهدف أحد التحديات المذكورة أعلاه: وكيل استرجاع المعلومات (IR) يقوم باستخراج البيانات ذات الصلة، وكيل اختيار المخطط (SS) يقوم بتقليم مخططات قواعد البيانات الكبيرة، وكيل إنشاء المرشحين (CG) يولد مرشحين ذوي جودة عالية ويكرر تحسين المستعلمات، ووكيل الاختبار الوحدي (UT) يقوم بتحقق من صحة المستعلمات من خلال اختبارات وحدة اللغة الطبيعية القائمة على نماذج اللغات الكبيرة.يوفر إطارنا خصائص قابلة للتكوين تناسب مختلف القيود التشغيلية:1) دعم قواعد البيانات الصناعية: من خلال الاستفادة من وكيل اختيار المخطط، يتمكن نظام CHESS من تقليص مخططات قواعد البيانات الضخمة بشكل كفؤ إلى فهارس فرعية قابلة للإدارة، مما يعزز دقة النظام بنسبة حوالي 2% ويقلل عدد الرموز في نماذج اللغات الكبيرة بمقدار 5 أضعاف.2) الأداء الحافظ للخصوصية الأكثر حداثة: بين الطرق التي تستخدم النماذج المصدر المفتوح، يحقق نظام CHESS أفضل الأداء الحالي، مما يؤدي إلى نظام عالي الأداء ومحافظ على الخصوصية مناسب للنشر الصناعي.3) القابلية للتوسع مع زيادة الميزانية الحسابية: في البيئات ذات الميزانيات الحسابية العالية، يصل نظام CHESS إلى دقة 71.10% على مجموعة اختبار BIRD، ضمن نطاق 2% من أفضل طريقة خاصة قائدة في هذا المجال، مع الحاجة إلى حوالي 83% أقل من مكالمات نماذج اللغات الكبيرة.

CHESS: الاستخدام السياقي لتحسين توليف SQL بكفاءة | الأوراق البحثية | HyperAI