HyperAIHyperAI

Command Palette

Search for a command to run...

MedConceptsQA: معيار مفاهيم طبية مفتوح المصدر للأسئلة والأجوبة

Ofir Ben Shoham Nadav Rappoport

الملخص

نقدّم MedConceptsQA، معيارًا مفتوح المصدر مخصصًا لاختبار فهم المفاهيم الطبية من خلال الإجابة على الأسئلة. يتكوّن هذا المعيار من أسئلة متعددة حول مفاهيم طبية مختلفة ضمن مفردات متنوعة: التشخيصات، الإجراءات، والأدوية. وتصنّف الأسئلة إلى ثلاث مستويات من الصعوبة: سهلة، متوسطة، وصعبة. قمنا بتقييم هذا المعيار باستخدام نماذج لغوية كبيرة مختلفة. وقد أظهرت النتائج أن النماذج الكبيرة المُدرّبة مسبقًا على بيانات طبية لم تحقق دقةً تقترب من التخمين العشوائي في هذا المعيار، رغم تدريبها على بيانات طبية. ومع ذلك، حقّق نموذج GPT-4 تحسّنًا متوسّطًا مطلقًا قدره ما بين 27% إلى 37% مقارنةً بالنماذج الطبية الكبيرة (27% في سيناريو التعلم من صفر، و37% في سيناريو التعلم بعينات قليلة). يُعدّ هذا المعيار موردًا قيمًا لتقييم فهم وتميّز النماذج الكبيرة للغة في المفاهيم الطبية. يمكن الوصول إلى المعيار عبر الرابط التالي: https://huggingface.co/datasets/ofir408/MedConceptsQA


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp