جامعة شنغهاي جياو تونغ تصدر مجموعة بيانات تحليل الصور الطبية MedMNIST ومعيارًا جديدًا

يعد تحليل الصور الطبية مجالًا معقدًا للغاية ومتعدد التخصصات. أصدرت جامعة شنغهاي جياو تونغ مؤخرًا مجموعة بيانات MedMNIST، والتي من المتوقع أن تعزز تطوير تحليل الصور الطبية.
صداع تحليل الصور الطبية
يعد تحليل الصور الطبية موضوعًا "صعبًا" معترفًا به.
أولاً، إنه مجال متعدد التخصصات.يُطلب من الممارسين أن يكون لديهم مجموعة واسعة من الخلفيات المعرفية. حتى لو كنت متخصصًا في دراسة الرؤية الحاسوبية أو ممارسًا للطب السريري، ففي أفضل الأحوال تكون قد اتخذت نصف خطوة فقط نحو تحليل الصور الطبية.
بتفاؤل، وبعد سنوات من الدراسة والبحث، أتقنت أخيرًا مهارات الرؤية الحاسوبية والطب السريري ذات الاتجاهين، والخطوات التالية ستجعلك تشعر بالقلق حتى الموت.لأن هذه البيانات تأتي من مصادر مختلفة، بما في ذلك الأشعة السينية، والأشعة المقطعية، والموجات فوق الصوتية...من الصعب جدًا تحليل ومعالجة العديد من مجموعات البيانات غير القياسية ذات الأنماط المختلفة!
هذه ليست النهاية. على الرغم من أن التعلم العميق قد هيمن على البحث وتطبيق تحليل الصور الطبية، إلا أن تكلفة القوى العاملة اللازمة لتعديل النموذج مرتفعة للغاية. AutoML مفيد،ومع ذلك، لا توجد حاليًا معايير AutoML لتصنيف الصور الطبية.

إن تحليل الصور الطبية محفوف بالصعوبات، ولكن مجموعة بيانات MedMNIST التي أصدرتها جامعة شنغهاي جياو تونغ مؤخرًا توفر أداة قوية لحل هذه المشاكل طويلة الأمد.
10 مجموعات بيانات عامة، 450,000 صورة أعيد تنظيمها
MedMNIST عبارة عن مجموعة من 10 مجموعات بيانات طبية عامة.تمت معالجة كافة البيانات مسبقًا وتقسيمها إلى مجموعات بيانات قياسية بما في ذلك مجموعة التدريب ومجموعة التحقق ومجموعة الاختبار. تتضمن مصادر البيانات أوضاع تصوير مختلفة مثل الأشعة السينية، والتصوير المقطعي البصري، والموجات فوق الصوتية، والتصوير المقطعي المحوسب، وما إلى ذلك، ويتم الحصول على بيانات متعددة الوسائط لنفس الآفة. مثل مجموعة بيانات MNIST،يمكن لـMedMNIST إجراء مهام التصنيف على صور خفيفة الوزن بحجم 28*28.

يتمتع MedMNIST بالخصائص التالية:
تعليمي:وتأتي البيانات متعددة الوسائط من مجموعات بيانات متعددة للصور الطبية العامة وتستخدم ترخيص المشاع الإبداعي (CC) أو الترخيص المجاني لتسهيل الاستخدام التعليمي.
التوحيد القياسي:لقد تمت معالجة كافة البيانات مسبقًا بنفس التنسيق، مما أدى إلى خفض حاجز الدخول وجعلها متاحة لأي شخص.
تنوع:تغطي مجموعة البيانات متعددة الوسائط أوضاع بيانات مختلفة، وتدعم أحجام بيانات تتراوح من 100 إلى 100000، كما تم إثراء أنواع المهام أيضًا في التصنيف الثنائي، والتصنيف المتعدد المتغيرات، والانحدار الترتيبي، والتصنيف المتعدد.
خفيف الوزن:يُسهّل حجم الصورة 28*28 إنشاء النماذج الأولية بسرعة والتكرار السريع والتجريب لخوارزميات التعلم الآلي المتعدد الوسائط وAutoML.
مجموعة بيانات MedMNIST
وكالة النشر:جامعة شنغهاي جياو تونغ
الكمية المتضمنة:454,591 صورة
تنسيق البيانات:منطقة نبراسكا الوطنية
حجم البيانات:654 ميجابايت
وقت الإصدار:28 أكتوبر 2020
عنوان التنزيل:http://dwz.date/dew2
طريقة العشاري جيدة، حيث أنها تخلق معيارًا جديدًا لـ AutoML
مستوحاة من مسابقة العشاري للتجزئة الطبية،أصدر باحثون من جامعة شنغهاي جياو تونغ أيضًا مسابقة MedMNIST Classification Decathlon كمعيار خفيف الوزن لـ AutoML في تصنيف الصور الطبية.
استخدم الباحثون مسابقة تصنيف MedMNIST لتقييم أداء الخوارزمية على جميع مجموعات البيانات العشر، وقارنوها بالعديد من الطرق الأساسية الأخرى، بما في ذلك ResNets (18، 50)، وauto-sklearn، وAutoKeras، وGoogle AutoML Vision.

تظهر النتائج التجريبية أنه لا يوجد خوارزمية في التجربة يمكنها تحقيق أداء تعميم جيد لجميع مجموعات البيانات العشر.تتمتع هذه التجربة بأهمية كبيرة لاستكشاف خوارزميات AutoML التي يمكن تعميمها بشكل جيد عبر أوضاع البيانات المختلفة وأنواع المهام ومقاييس البيانات.
سوف يعمل معيار تصنيف مسابقة MedMNIST العشارية على تعزيز الأبحاث المستقبلية حول AutoML لتحليل الصور الطبية.
أوراق ذات صلة:
عنوان المصدر المفتوح:
https://github.com/MedMNIST/MedMNIST
الآن قم بتنزيل مجموعة البيانات وابدأ التدريب
قم بتنزيل مجموعة البيانات، وقم بتدريب نموذج التعلم الآلي عبر الإنترنت، وابدأ ممارستك مع OpenBayes.
OpenBayes عبارة عن منصة خدمة سحابية توفر قوة الحوسبة السحابية للتعلم الآلي. يحتوي على مجموعة حوسبة فائقة واسعة النطاق، ويدعم موارد الحوسبة GPU وCPU من تكوينات مختلفة، ويحتوي على نظام نمذجة التعلم الآلي للأغراض العامة والذي يمكن استخدامه جاهزًا للاستخدام. يمكن إنشاء الأنظمة الذكية بسرعة دون الحاجة إلى خبرة التعلم الآلي.
حاليًا، تدعم منتجات حاويات الطاقة الحاسوبية الخاصة بـ OpenBayes بالفعل TensorFlow وPyTorch وMXNet وDarknet وcpp-develop وما إلى ذلك في بيئات وحدة المعالجة المركزية ووحدة معالجة الرسومات، إصدارات وأنواع مختلفة من أطر التعلم الآلي القياسية والتبعيات المشتركة المتنوعة.

كما يوفر OpenBayes أيضًا وحدة المعالجة المركزية، وNVIDIA T4، وNVIDIA Tesla V100 وموارد الحوسبة الأخرىسواء كان الأمر يتعلق بالتدريب المركزي للبيانات الضخمة أو تشغيل نموذج مقيم منخفض الطاقة، فإنه يمكنه تلبية احتياجات المستخدم بسهولة.

مجموعة بيانات MedMNIST متاحة الآن على OpenBayes.

قم بزيارة openbayes.com قم بالتسجيل كمستخدم جديد باستخدام رمز الدعوة [HyperAI]يمكنك الاستمتاع240 دقيقة من وحدة المعالجة المركزية + 180 دقيقة من وحدة معالجة الرسومات NVIDIA vGPU أسبوعيًا قوة الحوسبة المجانية~
وصولالروابط التاليةأوانقر لقراءة المقال الأصليابدأ رحلة استكشاف MedMNIST الخاصة بك!
الرابط: http://dwz.date/dew2
-- زيادة--