HyperAIHyperAI
منذ 2 أشهر

Seq2SQL: توليد استعلامات هيكلية من اللغة الطبيعية باستخدام التعلم التعزيزي

Victor Zhong; Caiming Xiong; Richard Socher
Seq2SQL: توليد استعلامات هيكلية من اللغة الطبيعية باستخدام التعلم التعزيزي
الملخص

يُخزَّن جزء كبير من معرفة العالم في قواعد بيانات علائقية. ومع ذلك، فإن قدرة المستخدمين على استرجاع الحقائق من قاعدة البيانات محدودة بسبب عدم فهمهم للغات الاستفسار مثل SQL. نقترح نظام Seq2SQL، وهو شبكة عصبية عميقة لترجمة الأسئلة اللغوية الطبيعية إلى استفسارات SQL المقابلة. يستفيد نموذجنا من هيكل استفسارات SQL لتقليل المساحة الإخراجية للاستفسارات المولدة بشكل كبير. بالإضافة إلى ذلك، نستخدم مكافآت تنفيذ الاستفسار داخل الحلقة فوق قاعدة البيانات لتعلم سياسة توليد أجزاء الاستفسار غير المرتبة، والتي نظهر أنها أقل ملاءمةً للتحسين عبر خسارة التربيع العرضي (cross entropy loss). كما سننشر WikiSQL، وهو مجموعة بيانات تتضمن 80654 مثالاً تم توضيحها يدويًا من الأسئلة واستفسارات SQL موزعة على 24241 جدولًا من ويكيبيديا. هذه المجموعة البيانات ضرورية لتدريب نموذجنا وهي أكبر بعشرة أضعاف من المجموعات البيانات المشابهة. عن طريق تطبيق التعلم التعزيزي القائم على السياسة مع بيئة تنفيذ الاستفسار على WikiSQL، يتفوق نموذجنا Seq2SQL على النماذج المتتابعة المعتمدة على الانتباه (attentional sequence to sequence models)، مما يحسن دقة التنفيذ من 35.9% إلى 59.4% ودقة الصيغة المنطقية من 23.4% إلى 48.3%.

Seq2SQL: توليد استعلامات هيكلية من اللغة الطبيعية باستخدام التعلم التعزيزي | أحدث الأوراق البحثية | HyperAI