HyperAI

مجموعة بيانات الإجابة على الأسئلة المنطوقة في المجال المفتوح من ODSQA

التاريخ

منذ 2 أعوام

الحجم

52.24 MB

المؤسسة

جامعة كورنيل

رابط النشر

github.com

ODSQA (مجموعة بيانات الإجابة على الأسئلة المنطوقة مفتوحة المجال) من ODSQA: مجموعة بيانات الإجابة على الأسئلة المنطوقة مفتوحة المجال . هذه مجموعة بيانات صينية. بالإضافة إلى ذلك، يتم توفير مجموعة بيانات باللغة الإنجليزية Spoken-SQuAD أيضًا.هنادُر.

فريق SQUAD المنطوق  إنه عبارة عن مجموعة من الأسئلة والإجابات المنطوقة التي تم إنشاؤها من مجموعة بيانات SQuAD عبر نظام تحويل النص إلى كلام (TTS) الخاص بـ Google. على الرغم من أن Spoken-SQuAD كبير بما يكفي لتدريب نماذج الإجابة على الأسئلة الذكية المتطورة، إلا أنه يتم إنشاؤه بشكل مصطنع وبالتالي لا يزال لديه فجوة معينة مع الإجابة على الأسئلة المنطوقة الحقيقية. وبناء على ذلك، أصدر الباحثون مجموعة بيانات SQA تحتوي على أكثر من ثلاثة آلاف سؤال، والتي تسمى ODSQA. إنها حاليًا أكبر مجموعة بيانات SQA في العالم الحقيقي لمهام الإجابة على الأسئلة الذكية القائمة على الاستخراج.

ODSQA.torrent
البذر 2التنزيل 0مكتمل 213إجمالي التنزيلات 414
  • ODSQA/
    • DRCD-TTS.json
      10.15 MB
    • DRCD-backtrans.json
      23.2 MB
    • ODSQA_spokenq_test-v1.1.json
      25.05 MB
    • ODSQA_textq_test-v1.1.json
      26.11 MB
    • README.md
      26.12 MB
    • README.txt
      26.12 MB
      • data/
        • DRCD-TTS.json
          36.27 MB
        • DRCD-backtrans.json
          49.32 MB
        • ODSQA_spokenq_test-v1.1.json
          51.17 MB
        • ODSQA_textq_test-v1.1.json
          52.23 MB
        • README.md
          52.24 MB
        • download.sh
          52.24 MB
    • download.sh
      52.24 MB