توليد استعلامات SQL القائمة على التحرير للأسئلة المعتمدة على السياق في مجالات مختلفة

نركز على مهمة توليد النص إلى SQL المعتمدة على السياق بين المجالات. بناءً على الملاحظة أن الأسئلة اللغوية الطبيعية المجاورة غالبًا ما تكون مترابطة لغويًا وأن الاستعلامات SQL المقابلة لها تميل إلى التداخل، نستفيد من سجل التفاعل بتعديل الاستعلام المتوقع سابقًا لتحسين جودة التوليد. ينظر آليتنا التعديلية إلى SQL كسلسلات ويستخدم نتائج التوليد على مستوى الرمز بطريقة بسيطة. إنها مرنة في تغيير الرموز الفردية وقوية في مقاومة انتشار الأخطاء. علاوة على ذلك، للتعامل مع الهياكل الجدولية المعقدة في مجالات مختلفة، نستخدم مرمِّز الجملة-الجدول ومفكِّك الـ table-aware لدمج سياق جملة المستخدم وهيكل الجدول. قمنا بتقييم نهجنا على مجموعة بيانات SParC وأظهرنا فوائد التعديل مقارنة بالأسس الحالية التي تولد SQL من الصفر. رمزنا متاح على https://github.com/ryanzhumich/sparc_atis_pytorch.