HyperAIHyperAI

مجموعة بيانات الإجابة على الأسئلة المنطوقة في المجال المفتوح من ODSQA

التاريخ

منذ 2 أعوام

الحجم

52.24 MB

المؤسسة

جامعة كورنيل

رابط النشر

github.com

رابط الورقة البحثية

arxiv.org

ODSQA (مجموعة بيانات الإجابة على الأسئلة المنطوقة مفتوحة المجال) من ODSQA: مجموعة بيانات الإجابة على الأسئلة المنطوقة مفتوحة المجال . هذه مجموعة بيانات صينية. بالإضافة إلى ذلك، يتم توفير مجموعة بيانات باللغة الإنجليزية Spoken-SQuAD أيضًا.هنادُر.

فريق SQUAD المنطوق  إنه عبارة عن مجموعة من الأسئلة والإجابات المنطوقة التي تم إنشاؤها من مجموعة بيانات SQuAD عبر نظام تحويل النص إلى كلام (TTS) الخاص بـ Google. على الرغم من أن Spoken-SQuAD كبير بما يكفي لتدريب نماذج الإجابة على الأسئلة الذكية المتطورة، إلا أنه يتم إنشاؤه بشكل مصطنع وبالتالي لا يزال لديه فجوة معينة مع الإجابة على الأسئلة المنطوقة الحقيقية. وبناء على ذلك، أصدر الباحثون مجموعة بيانات SQA تحتوي على أكثر من ثلاثة آلاف سؤال، والتي تسمى ODSQA. إنها حاليًا أكبر مجموعة بيانات SQA في العالم الحقيقي لمهام الإجابة على الأسئلة الذكية القائمة على الاستخراج.

ODSQA.torrent
البذر 1التنزيل 0مكتمل 252إجمالي التنزيلات 491
  • ODSQA/
    • DRCD-TTS.json
      10.15 MB
    • DRCD-backtrans.json
      23.2 MB
    • ODSQA_spokenq_test-v1.1.json
      25.05 MB
    • ODSQA_textq_test-v1.1.json
      26.11 MB
    • README.md
      26.12 MB
    • README.txt
      26.12 MB
      • data/
        • DRCD-TTS.json
          36.27 MB
        • DRCD-backtrans.json
          49.32 MB
        • ODSQA_spokenq_test-v1.1.json
          51.17 MB
        • ODSQA_textq_test-v1.1.json
          52.23 MB
        • README.md
          52.24 MB
        • download.sh
          52.24 MB
    • download.sh
      52.24 MB
مجموعة بيانات الإجابة على الأسئلة المنطوقة في المجال المفتوح من ODSQA | مجموعات البيانات | HyperAI