Command Palette
Search for a command to run...
مجموعة بيانات التقييم الطبي متعدد الوسائط PubMedVision
التاريخ
رابط الورقة البحثية
الترخيص
Apache 2.0
PubMedVision هي مجموعة بيانات لتقييم القدرات الطبية متعددة الوسائط، أصدرها عام ٢٠٢٤ معهد شنتشن لأبحاث البيانات الضخمة، وجامعة هونغ كونغ الصينية (شنتشن)، والمعهد الوطني للبيانات الضخمة الطبية (شنتشن). نتائج البحث ذات الصلة هي:رؤية HuatuoGPT، نحو إدخال المعرفة البصرية الطبية في برامج الماجستير في القانون متعدد الوسائط على نطاق واسع"، والذي يهدف إلى توفير موارد اختبار موحدة لنماذج اللغة الكبيرة متعددة الوسائط (MLLMs) في مهام فهم النصوص البصرية الطبية لاختبار اندماج المعرفة البصرية وأداء التفكير في المجال الطبي.
تحتوي هذه المجموعة من البيانات على ما يقارب 1.3 مليون مثال على إجابات الأسئلة الطبية البصرية (VQA)، بما في ذلك 647,031 مثالًا مُنسّقًا، و647,031 مثالًا آخر مُعدّلًا بدقة قائمًا على التعليمات. بُنيت البيانات من 914,960 صورة طبية مُختارة بعناية، بالإضافة إلى سياقها المُصاحب (مثل العناوين والاقتباسات النصية)، والتي تُغطي مجموعة متنوعة من أساليب التصوير الطبي والمناطق التشريحية. يتكون كل مثال من صورة ونص توضيحي من بحث طبي. تُستخدم نماذج لغوية كبيرة متعددة الوسائط (مثل GPT-4V) لإنشاء وصف الصورة والسؤال والإجابة المُقابلة.

بناء الذكاء الاصطناعي بالذكاء الاصطناعي
من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.