HyperAIHyperAI
منذ 2 أشهر

CHASE-SQL: الاستدلال متعدد المسارات وتحسين المرشحين المختارين في تحويل النص إلى SQL

Pourreza, Mohammadreza ; Li, Hailong ; Sun, Ruoxi ; Chung, Yeounoh ; Talaei, Shayan ; Kakkar, Gaurav Tarlok ; Gan, Yu ; Saberi, Amin ; Ozcan, Fatma ; Arik, Sercan O.
CHASE-SQL: الاستدلال متعدد المسارات وتحسين المرشحين المختارين في تحويل النص إلى SQL
الملخص

في مواجهة تحديات أداء نماذج اللغة الكبيرة (LLM) في مهام تحويل النص إلى SQL، نقدم CHASE-SQL، إطارًا جديدًا يستخدم استراتيجيات مبتكرة، حيث يتم استخدام الحوسبة في وقت الاختبار في نمذجة الوكلاء المتعددين لتحسين توليد واختيار المرشحين. يعتمد CHASE-SQL على المعرفة الداخلية لنماذج اللغة الكبيرة لتوليد مرشحين SQL متنوعين وعالي الجودة باستخدام مولدات LLM مختلفة مع: (1) طريقة تقسيم وحل تجزئ الأستفسارات المعقدة إلى استفسارات فرعية قابلة للإدارة في دعوة واحدة لنموذج LLM؛ (2) استدلال سلسلة التفكير بناءً على خطط تنفيذ الاستفسارات، والتي تعكس الخطوات التي يقوم بها محرك قاعدة البيانات أثناء التنفيذ؛ و(3) تقنية توليد أمثلة اصطناعية واعية بالحالة، والتي توفر عروض قليلة الإبراز محددة للاستفسارات الاختبارية.لتحديد أفضل مرشح، يتم استخدام وكيل اختيار لتصنيف المرشحين من خلال مقارنات ثنائية باستخدام نموذج LLM منتقى بدقة لاختيار المرشحين الثنائيين. أثبتت هذه الطريقة في الاختيار أنها أكثر صلابة مقارنة بالبدائل الأخرى. لا يقتصر الإطار المقترح للمولدات والاختيار على تعزيز جودة ومتنوعية استفسارات SQL فحسب، بل يتفوق أيضًا على الطرق السابقة. بشكل عام، حقق الإطار المقترح CHASE-SQL دقة تنفيذ رائدة في مجالها تبلغ 73.0% و73.01% على مجموعة الاختبار ومجموعة التطوير الخاصة بمجموعة بيانات BIRD Text-to-SQL الشهيرة، مما يجعل CHASE-SQL أعلى تسجيل في لوحة الترتيب (في وقت تقديم الورقة).