معرّف-إلى-SQL: تحسين توليد SQL باستخدام LLM خبير في البيانات

إن إنشاء استعلامات SQL دقيقة استجابةً لأسئلة المستخدمين (التحويل من النص إلى SQL) يُعدّ تحديًا قائمًا منذ فترة طويلة، إذ يتطلب فهمًا عميقًا لكل من سؤال المستخدم والهيكل المتعلق بالقاعدة البيانات لاسترجاع المحتوى المطلوب بدقة. تعتمد الطرق الحالية على القدرات الشاملة للنماذج اللغوية الكبيرة (LLMs) لإنشاء استعلامات SQL. ومع ذلك، فإن بعض المعرفة الضرورية لا تُدرج صراحةً في هيكل القاعدة البيانات أو في سؤال المستخدم، وقد تم تعلّمها من قبل النماذج اللغوية الكبيرة. وبما أن هذه المعرفة غير متوفرة بشكل صريح، فإن الاستعلامات SQL الناتجة عن الأسئلة التي تعاني من نقص في المعرفة قد تكون غير دقيقة، مما يؤثر سلبًا على أداء وثبات نماذج التحويل من النص إلى SQL. ولحل هذا التحدي، نقترح إطار عمل يُسمى Knowledge-to-SQL، والذي يستخدم نموذجًا لغويًا خبيرًا في البيانات (DELLM) مخصصًا لتوفير معرفة مفيدة لجميع نماذج التحويل من النص إلى SQL. وبشكل خاص، نقدم تفاصيل التنفيذ المفصلة لـ DELLM فيما يتعلق بقراءة الجداول وعملية التدريب الدقيق الأساسية. كما نقترح استراتيجية تُسمى التعلم بالترغيب من خلال التغذية الراجعة من قاعدة البيانات (PLDBF)، التي تُحسّن من قدرة DELLM على إنتاج معرفة أكثر فائدة للنماذج اللغوية الكبيرة. وقد أثبتت التجارب الواسعة أن DELLM يعزز الأدوات الرائدة في مجال التحويل من النص إلى SQL. وتم إصدار الشفرة البرمجية المقابلة لـ DELLM لدعم الأبحاث المستقبلية.