HIE-SQL: شبكة مُعززة بمعلومات التاريخ للتحليل الدلالي للنصوص إلى SQL المعتمد على السياق

في الآونة الأخيرة، لاقت عملية تحليل معنى النص إلى SQL التي تعتمد على السياق، والتي تُحوِّل اللغة الطبيعية إلى أوامر SQL ضمن عملية تفاعلية، اهتمامًا كبيرًا. تعتمد الدراسات السابقة على معلومات الاعتماد على السياق إما من سجلات التفاعل السابقة أو من الاستعلامات المُتنبَّأ بها سابقًا، لكنها تفشل في الاستفادة من كليهما معًا بسبب عدم التوافق بين اللغة الطبيعية وصيغة SQL المنطقية. في هذا العمل، نقترح نموذجًا مُحسَّنًا لمعلومات التاريخ في النص إلى SQL (HIE-SQL) لاستغلال معلومات الاعتماد على السياق من كلا المصدرين: السجلات التاريخية للعبارات والاستعلام SQL الأخير المُتنبَّأ به. وباعتبار الفجوة بين اللغة الطبيعية وSQL، نعامل اللغة الطبيعية وSQL كنوعين مختلفين من البيانات (موداليتين) ونُقدِّم نموذجًا مُدرَّبًا مسبقًا ثنائي المودال (Bimodal Pre-trained Model) لتقليل هذه الفجوة. علاوةً على ذلك، صممنا رسمًا توصيليًا يربط بين البنية (Schema-linking Graph) لتعزيز الاتصال بين العبارات والاستعلام SQL من جهة، وبين قواعد البيانات (البنية) من جهة أخرى. ونُظهر أن طرقنا المُحسَّنة باستخدام معلومات التاريخ تُحسِّن أداء HIE-SQL بشكل ملحوظ، حيث تحقق نتائج جديدة في مستوى الحد الأقصى (State-of-the-art) على مجموعتي بيانات معيارين اعتمادًا على السياق في مهام النص إلى SQL، وهما SparC وCoSQL، في وقت كتابة هذا البحث.