HyperAIHyperAI

Command Palette

Search for a command to run...

مجموعة بيانات معيارية لاختبار الكفاءة الطبية متعدد اللغات MMedBench

Date

منذ عام واحد

Size

20.69 MB

Organization

جامعة شنغهاي جياو تونغ

Publish URL

github.com

License

CC BY-NC-SA 3.0

MMedBench هي مجموعة بيانات شاملة لاختبار الكفاءة الطبية متعدد اللغات تم تطويرها بواسطة فريق الرعاية الصحية الذكية في كلية الذكاء الاصطناعي بجامعة شنغهاي جياو تونغ في عام 2024.نحو بناء نموذج لغوي متعدد اللغات للطبيهدف إلى تقييم تطور نماذج متعددة اللغات في المجال الطبي، تغطي 6 لغات و21 مجالًا فرعيًا طبيًا. جميع أسئلة MMedBench مستمدة مباشرةً من بنوك أسئلة الامتحانات الطبية في مختلف البلدان، مما يضمن دقة وموثوقية التقييم، ويجنب التحيز في فهم التشخيص الناتج عن اختلاف إرشادات الممارسة الطبية في مختلف البلدان.

يتضمن معيار التقييم بعدين رئيسيين للتقييم: دقة الاختيار وعقلانية التفسير. أثناء عملية التقييم، لا يحتاج النموذج إلى اختيار الإجابة الصحيحة فحسب، بل يجب عليه أيضًا تقديم تفسير معقول، وبالتالي اختبار قدرة النموذج على فهم وتفسير المعلومات الطبية المعقدة. تُظهر إحصائيات بيانات MMedBench الإحصائيات الرقمية الأساسية لمجموعة التدريب ومجموعة الاختبار، بالإضافة إلى توزيع العينات حول مواضيع مختلفة.

قام فريق البحث بتقييم نماذج اللغة الطبية السائدة على معيار MMedBench، بما في ذلك ثلاث استراتيجيات اختبار: Zero-shot، وPEFT Finetuning، وFull model Finetuning. وتظهر نتائج الاختبار أن النموذج المقترح يتفوق على نماذج المصدر المفتوح الموجودة من نفس المستوى في بعدين رئيسيين: دقة الاختيار وعقلانية التفسير، وهو قابل للمقارنة مع GPT-4. بالإضافة إلى ذلك، أجرى فريق البحث أيضًا تقييمًا يدويًا للتسجيل، حيث كان النموذج المقترح هو المفضل لدى المستخدمين البشر.

إن إطلاق MMedBench لا يعزز فقط الأبحاث النموذجية متعددة اللغات على نطاق واسع في المجال الطبي، بل يوفر أيضًا أدوات جديدة للممارسة السريرية، وخاصة إظهار الإمكانات الكبيرة في حل الحواجز اللغوية وعولمة الموارد الطبية. وقد أصبحت جميع البيانات والرموز مفتوحة المصدر، مما يعزز التعاون وتبادل التكنولوجيا بين مجتمع البحث العالمي.

إحصائيات بيانات MMedBench. يوضح الشكل (أ) الإحصائيات الرقمية الأساسية لمجموعة تدريب MMedBench ومجموعة الاختبار؛ يوضح الشكل ب توزيع عينات MMedBench حول مواضيع مختلفة.

MMedBench.torrent
Seeding 1Downloading 0Completed 161Total Downloads 406
  • MMedBench/
    • README.md
      2.67 KB
    • README.txt
      5.33 KB
      • data/
        • MMedBench.zip
          20.69 MB

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp