HyperAI

مجموعة بيانات بحثية لتصنيف نصوص الأسئلة المكررة في Quora

التاريخ

منذ 2 أعوام

الحجم

55.48 MB

المؤسسة

كورا

رابط النشر

data.quora.com

مجموعة بيانات الأسئلة المكررة في Quora هي مجموعة بيانات تستخدم لتحديد ما إذا كانت أزواج الأسئلة في النص مكررة أم لا. يتم استخدامه في أبحاث تصنيف النصوص ويهدف إلى توفير الفرصة لأي شخص لتدريب واختبار النماذج المكافئة دلاليًا.

تتكون مجموعة البيانات من أكثر من 400000 صف من أزواج الأسئلة المكررة المحتملة، حيث يحتوي كل صف على معرف السؤال والنص الكامل للسؤال وقيمة ثنائية تشير إلى ما إذا كان الصف يحتوي على زوج مكرر.

تم إصدار مجموعة البيانات هذه بواسطة فريق Quora في عام 2017، وكان الناشرون الرئيسيون هم Shankar Iyer وNikhil Dandekar وKornél Csernai.

quora_duplicate_questions.torrent
البذر 3التنزيل 0مكتمل 687إجمالي التنزيلات 1,344
  • quora_duplicate_questions/
    • README.md
      1.15 KB
    • README.txt
      2.29 KB
      • data/
        • quora_duplicate_questions.tsv
          55.48 MB