HyperAI

مجموعة بيانات تحويل النصوص المحادثة إلى SQL من CoSQL

التاريخ

منذ 5 أشهر

الحجم

100.44 MB

المؤسسة

جامعة ييل

رابط النشر

yale-lily.github.io

تم اقتراح مجموعة بيانات CoSQL (تحدي تحويل النص إلى SQL) من قبل جامعة ييل في EMNLP2019. ويهدف إلى بناء مجموعة بيانات لأنظمة حوار استعلامات قواعد البيانات العامة متعددة المجالات.

يحتوي CoSQL على أكثر من 3 آلاف مجموعة من المحادثات، وإجمالي أكثر من 10 آلاف استعلام SQL مُعلّق، تمتد عبر 200 قاعدة بيانات، وقواعد البيانات التي تستخدمها مجموعات مختلفة من البيانات ليس لها تقاطع، من أجل فحص قوة النموذج. تحاكي مجموعة البيانات استعلامات قاعدة البيانات في السيناريوهات الحقيقية. قد يكون لدى المستخدمين جولات متعددة من الاستفسارات، مما يتطلب من النظام أن يتمتع بالقدرة على دمج المعلومات.

يتكون CoSQL من 3 مهام:

  • تعقب حالة الحوار المستند إلى SQL: بناءً على سجل التفاعل، يتم تحويله إلى عبارات SQL المقابلة.
  • إنشاء استجابات باللغة الطبيعية: إنشاء استجابات باللغة الطبيعية استنادًا إلى عبارات SQL والنتائج المرتجعة.
  • التنبؤ بتصرفات حوار المستخدم: بالنسبة لسؤال كل مستخدم، حدد علامة المستخدم في قاعدة البيانات التي ينتمي إليها.
CoSQL.torrent
البذر 2التنزيل 1مكتمل 43إجمالي التنزيلات 68
  • CoSQL/
    • README.md
      1.54 KB
    • README.txt
      3.09 KB
      • data/
        • cosql_dataset.zip
          100.44 MB