مجموعة بيانات طبية متعددة الوسائط واسعة النطاق MedTrinity-25M
التاريخ
رابط النشر
العلامات
هذه المجموعة من البيانات هي مجموعة بيانات طبية متعددة الوسائط واسعة النطاق تم إطلاقها بشكل مشترك من قبل فرق بحثية من جامعة هواتشونغ للعلوم والتكنولوجيا، وجامعة كاليفورنيا، سانتا كروز، وجامعة هارفارد، وجامعة ستانفورد في عام 2024. نتائج الورقة ذات الصلة هي "MedTrinity-25M: مجموعة بيانات متعددة الوسائط واسعة النطاق مع تعليقات توضيحية متعددة الحبيبات للطب".
يحتوي MedTrinity-25M على أكثر من 25 مليون صورة طبية تغطي 10 طرق تصوير ويتم شرح أكثر من 65 مرضًا. لا تحتوي مجموعة البيانات هذه على تعليقات توضيحية عالمية ومحلية غنية فحسب، بل تدمج أيضًا تعليقات توضيحية للمعلومات متعددة المستويات في وسائط متعددة (مثل التصوير المقطعي المحوسب، والتصوير بالرنين المغناطيسي، والأشعة السينية، وما إلى ذلك). تتضمن هذه التعليقات نوع المرض أو الآفة، وطريقة التصوير، والأوصاف الخاصة بالمنطقة، والعلاقات بين الأعضاء. من خلال المعالجة المسبقة ودمج البيانات من أكثر من 90 مصدرًا مختلفًا، قام فريق البحث بتطوير خط أنابيب فريد لبناء البيانات تلقائيًا لتوليد تعليقات توضيحية مرئية ونصية متعددة المستويات. تتخطى هذه الطريقة حدود الاعتماد التقليدي على النص المقترن بالصورة وتحقق التوليد التلقائي للتعليقات التوضيحية. ستوفر مجموعة البيانات هذه دعمًا كبيرًا للمهام متعددة الوسائط مثل معالجة الصور الطبية وإنشاء التقارير والتصنيف والتجزئة، مع تعزيز التدريب المسبق لنماذج الذكاء الاصطناعي القائمة على الطب.
