مجموعة بيانات الإجابة على الأسئلة المنطوقة في المجال المفتوح من ODSQA
التاريخ
الحجم
رابط النشر
العلامات
ODSQA (مجموعة بيانات الإجابة على الأسئلة المنطوقة مفتوحة المجال) من ODSQA: مجموعة بيانات الإجابة على الأسئلة المنطوقة مفتوحة المجال . هذه مجموعة بيانات صينية. بالإضافة إلى ذلك، يتم توفير مجموعة بيانات باللغة الإنجليزية Spoken-SQuAD أيضًا.هنادُر.
فريق SQUAD المنطوق إنه عبارة عن مجموعة من الأسئلة والإجابات المنطوقة التي تم إنشاؤها من مجموعة بيانات SQuAD عبر نظام تحويل النص إلى كلام (TTS) الخاص بـ Google. على الرغم من أن Spoken-SQuAD كبير بما يكفي لتدريب نماذج الإجابة على الأسئلة الذكية المتطورة، إلا أنه يتم إنشاؤه بشكل مصطنع وبالتالي لا يزال لديه فجوة معينة مع الإجابة على الأسئلة المنطوقة الحقيقية. وبناء على ذلك، أصدر الباحثون مجموعة بيانات SQA تحتوي على أكثر من ثلاثة آلاف سؤال، والتي تسمى ODSQA. إنها حاليًا أكبر مجموعة بيانات SQA في العالم الحقيقي لمهام الإجابة على الأسئلة الذكية القائمة على الاستخراج.