HyperAIHyperAI
منذ 7 أيام

CoSQL: تحدي ترجمة النص إلى SQL متعدد الحوارات نحو واجهات طبيعية متعددة المجالات للقواعد البيانات

Tao Yu, Rui Zhang, He Yang Er, Suyi Li, Eric Xue, Bo Pang, Xi Victoria Lin, Yi Chern Tan, Tianze Shi, Zihan Li, Youxuan Jiang, Michihiro Yasunaga, Sungrok Shim, Tao Chen, Alexander Fabbri, Zifan Li, Luyao Chen, Yuwen Zhang, Shreya Dixit, Vincent Zhang, Caiming Xiong, Richard Socher, Walter S Lasecki, Dragomir Radev
CoSQL: تحدي ترجمة النص إلى SQL متعدد الحوارات نحو واجهات طبيعية متعددة المجالات للقواعد البيانات
الملخص

نقدم "CoSQL"، وهو مجموعة بيانات مخصصة لبناء أنظمة حوارية قادرة على استعلام قواعد بيانات عامة ومتعددة المجالات. تضم هذه المجموعة أكثر من 30 ألف تفاعل، بالإضافة إلى أكثر من 10 آلاف استعلام مُوسوم بـ SQL، مستمدة من مجموعة تجريبية من 3000 حوار تُجرب في بيئة "ساحر العوالم" (Wizard-of-Oz)، تتناول استعلامات لـ 200 قاعدة بيانات معقدة تمتد عبر 138 مجالًا مختلفًا. يُحاكي كل حوار سيناريو استعلام حقيقي في قاعدة بيانات، حيث يُمثل عامل جماعي (من الجمهور) المستخدم الذي يُجري استفسارات على قاعدة البيانات، بينما يُمثل خبير في SQL الإجابة عبر كتابة استعلامات SQL، أو توضيح الأسئلة الغامضة، أو إعلام المستخدم بأن السؤال لا يمكن الإجابة عنه. عندما تكون الأسئلة قابلة للإجابة عبر SQL، يُفسر الخبير الاستعلام والنتائج الناتجة للمستخدم، مما يضمن تدفقًا طبيعيًا في التفاعل. تُقدِّم CoSQL تحديات جديدة مقارنةً بال datasets الحالية الموجهة للمهام، إذ: (1) تُبنى حالة الحوار على أساس SQL، أي تمثيل قابل للتنفيذ مستقل عن المجال، بدلًا من أزواج المفاتيح-القيم المحددة لكل مجال، و(2) نظرًا لأن الاختبار يتم على قواعد بيانات لم تُرَ من قبل، يتطلب النجاح التعميم على مجالات جديدة. تشمل CoSQL ثلاث مهام رئيسية: تتبع حالة الحوار المبنية على SQL، توليد الاستجابات بناءً على نتائج الاستعلام، وتوقع نشاط المستخدم في الحوار. قمنا بتقييم مجموعة من النماذج القوية لكل مهمة، وبيّنّا أن CoSQL تمثل تحديات كبيرة للبحث المستقبلي. سيتم إصدار مجموعة البيانات، والأسس الأولية (baselines)، وجدول الترتيب (leaderboard) عبر الرابط: https://yale-lily.github.io/cosql.

CoSQL: تحدي ترجمة النص إلى SQL متعدد الحوارات نحو واجهات طبيعية متعددة المجالات للقواعد البيانات | أحدث الأوراق البحثية | HyperAI