HyperAI

مجموعة بيانات الإجابة على أسئلة النصوص الطبية MedQA

التاريخ

منذ 4 أشهر

الحجم

125.64 MB

المؤسسة

معهد ماساتشوستس للتكنولوجيا
جامعة هواتشونغ للعلوم والتكنولوجيا

رابط النشر

github.com

* هذه المجموعة من البيانات تدعم الاستخدام عبر الإنترنت.انقر هنا للقفز.

مجموعة بيانات MedQA عبارة عن مجموعة بيانات للأسئلة والإجابة عليها في المجال الطبي تحاكي أسلوب امتحان الترخيص الطبي في الولايات المتحدة (USMLE). تم إصداره من قبل فريق بحثي من معهد ماساتشوستس للتكنولوجيا وجامعة هواتشونغ للعلوم والتكنولوجيا في عام 2020. نتائج الورقة ذات الصلة هي "ما هو المرض الذي يعاني منه هذا المريض؟ مجموعة بيانات واسعة النطاق مفتوحة النطاق للإجابة على الأسئلة من الفحوصات الطبيةتم جمع مجموعة البيانات من الفحوصات الطبية المهنية، وتغطي اللغة الإنجليزية والصينية المبسطة والصينية التقليدية، وتحتوي على 12,723 و34,251 و14,123 سؤالاً على التوالي، بهدف تقييم فهم النموذج وتطبيقه للمعرفة الطبية.

يعتمد بناء مجموعة بيانات MedQA على اختبارات الترخيص الطبي المهني، مما يضمن الجودة العالية والاحترافية للأسئلة. بالإضافة إلى بيانات الأسئلة، تم جمع وإصدار مجموعة واسعة النطاق من الكتب الطبية، والتي يمكن لنموذج فهم القراءة من خلالها اكتساب المعرفة اللازمة للإجابة على الأسئلة. يتم تقسيم مجموعة البيانات إلى مجموعة التدريب ومجموعة التطوير ومجموعة الاختبار، والتي تستخدم لتدريب النموذج والتحقق منه واختباره على التوالي.

إحصائيات تقسيم مجموعة البيانات وطول الأسئلة والأجوبة
MedQA.torrent
البذر 2التنزيل 1مكتمل 83إجمالي التنزيلات 332
  • MedQA/
    • README.md
      1.75 KB
    • README.txt
      3.5 KB
      • data/
        • data_clean.zip
          125.64 MB