HyperAIHyperAI

Command Palette

Search for a command to run...

CoSQL: تحدي ترجمة النص إلى SQL متعدد الحوارات نحو واجهات طبيعية متعددة المجالات للقواعد البيانات

الملخص

نقدم "CoSQL"، وهو مجموعة بيانات مخصصة لبناء أنظمة حوارية قادرة على استعلام قواعد بيانات عامة ومتعددة المجالات. تضم هذه المجموعة أكثر من 30 ألف تفاعل، بالإضافة إلى أكثر من 10 آلاف استعلام مُوسوم بـ SQL، مستمدة من مجموعة تجريبية من 3000 حوار تُجرب في بيئة "ساحر العوالم" (Wizard-of-Oz)، تتناول استعلامات لـ 200 قاعدة بيانات معقدة تمتد عبر 138 مجالًا مختلفًا. يُحاكي كل حوار سيناريو استعلام حقيقي في قاعدة بيانات، حيث يُمثل عامل جماعي (من الجمهور) المستخدم الذي يُجري استفسارات على قاعدة البيانات، بينما يُمثل خبير في SQL الإجابة عبر كتابة استعلامات SQL، أو توضيح الأسئلة الغامضة، أو إعلام المستخدم بأن السؤال لا يمكن الإجابة عنه. عندما تكون الأسئلة قابلة للإجابة عبر SQL، يُفسر الخبير الاستعلام والنتائج الناتجة للمستخدم، مما يضمن تدفقًا طبيعيًا في التفاعل. تُقدِّم CoSQL تحديات جديدة مقارنةً بال datasets الحالية الموجهة للمهام، إذ: (1) تُبنى حالة الحوار على أساس SQL، أي تمثيل قابل للتنفيذ مستقل عن المجال، بدلًا من أزواج المفاتيح-القيم المحددة لكل مجال، و(2) نظرًا لأن الاختبار يتم على قواعد بيانات لم تُرَ من قبل، يتطلب النجاح التعميم على مجالات جديدة. تشمل CoSQL ثلاث مهام رئيسية: تتبع حالة الحوار المبنية على SQL، توليد الاستجابات بناءً على نتائج الاستعلام، وتوقع نشاط المستخدم في الحوار. قمنا بتقييم مجموعة من النماذج القوية لكل مهمة، وبيّنّا أن CoSQL تمثل تحديات كبيرة للبحث المستقبلي. سيتم إصدار مجموعة البيانات، والأسس الأولية (baselines)، وجدول الترتيب (leaderboard) عبر الرابط: https://yale-lily.github.io/cosql.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp