Command Palette
Search for a command to run...
CHASE-SQL: الاستدلال متعدد المسارات وتحسين المرشحين المختارين في تحويل النص إلى SQL
CHASE-SQL: الاستدلال متعدد المسارات وتحسين المرشحين المختارين في تحويل النص إلى SQL
Mohammadreza Pourreza extsuperscript1* Hailong Li extsuperscript1* Ruoxi Sun extsuperscript1 Yeounoh Chung extsuperscript1 Shayan Talaei extsuperscript2 Gaurav Tarlok Kakkar extsuperscript1 Yu Gan extsuperscript1 Amin Saberi extsuperscript2 Fatma Özcan extsuperscript1 Sercan Ö. Arik extsuperscript1
الملخص
في مواجهة تحديات أداء نماذج اللغة الكبيرة (LLM) في مهام تحويل النص إلى SQL، نقدم CHASE-SQL، إطارًا جديدًا يستخدم استراتيجيات مبتكرة، حيث يتم استخدام الحوسبة في وقت الاختبار في نمذجة الوكلاء المتعددين لتحسين توليد واختيار المرشحين. يعتمد CHASE-SQL على المعرفة الداخلية لنماذج اللغة الكبيرة لتوليد مرشحين SQL متنوعين وعالي الجودة باستخدام مولدات LLM مختلفة مع: (1) طريقة تقسيم وحل تجزئ الأستفسارات المعقدة إلى استفسارات فرعية قابلة للإدارة في دعوة واحدة لنموذج LLM؛ (2) استدلال سلسلة التفكير بناءً على خطط تنفيذ الاستفسارات، والتي تعكس الخطوات التي يقوم بها محرك قاعدة البيانات أثناء التنفيذ؛ و(3) تقنية توليد أمثلة اصطناعية واعية بالحالة، والتي توفر عروض قليلة الإبراز محددة للاستفسارات الاختبارية.لتحديد أفضل مرشح، يتم استخدام وكيل اختيار لتصنيف المرشحين من خلال مقارنات ثنائية باستخدام نموذج LLM منتقى بدقة لاختيار المرشحين الثنائيين. أثبتت هذه الطريقة في الاختيار أنها أكثر صلابة مقارنة بالبدائل الأخرى. لا يقتصر الإطار المقترح للمولدات والاختيار على تعزيز جودة ومتنوعية استفسارات SQL فحسب، بل يتفوق أيضًا على الطرق السابقة. بشكل عام، حقق الإطار المقترح CHASE-SQL دقة تنفيذ رائدة في مجالها تبلغ 73.0% و73.01% على مجموعة الاختبار ومجموعة التطوير الخاصة بمجموعة بيانات BIRD Text-to-SQL الشهيرة، مما يجعل CHASE-SQL أعلى تسجيل في لوحة الترتيب (في وقت تقديم الورقة).