Command Palette
Search for a command to run...
Med-Banana-50K: مجموعة بيانات كبيرة متعددة الوسائط للتعديل الصوري الطبي الموجه بالنص
Med-Banana-50K: مجموعة بيانات كبيرة متعددة الوسائط للتعديل الصوري الطبي الموجه بالنص
Zhihui Chen Mengling Feng
Abstract
أصبحت عملية تعديل الصور الطبية تقنية محورية ذات تطبيقات واسعة في تكبير البيانات، وتحسين قابلية تفسير النماذج، والتعليم الطبي، ومحاكاة العلاج. ومع ذلك، فإن نقص المجموعات الكبيرة من البيانات عالية الجودة والمتاحة مفتوحًا، المُعدّة خصيصًا للسياقات الطبية وتحت قيود هندسية وسريرية صارمة، قد عرقل تقدّم هذا المجال بشكل كبير. لسد هذه الفجوة، نقدّم مجموعة البيانات Med-Banana-50K، وهي مجموعة شاملة تضم أكثر من 50 ألف عملية تعديل صور طبية مُختارة بعناية، تغطي صور الأشعة السينية للصدر، و imágenes الرنين المغناطيسي للدماغ، وصور الشبكية (الفرسات) لـ23 مرضًا مختلفًا. يدعم كل عينة في هذه المجموعة تعديلات متعددة الاتجاهات للآفات (إضافة أو إزالة)، وتم بناؤها باستخدام نموذج Gemini-2.5-Flash-Image استنادًا إلى صور سريرية حقيقية. يتميّز هذا المجموعة ببروتوكول ضوابط جودة مبني على الأساس الطبي: حيث نستخدم إطار تقييم يعتمد على نموذج لغة كبير (LLM-as-Judge) مع معايير مثل الامتثال للتعليمات، والمنطق الهيكلي، وواقعية الصورة، وحفظ الولاء للصورة الأصلية، إلى جانب عملية تحسين تكرارية تصل إلى خمس جولات. علاوةً على ذلك، تضم مجموعة Med-Banana-50K نحو 37,000 محاولة فاشلة في التعديل، مع سجلات تقييم كاملة، لدعم أبحاث التعلّم المُفضّل والتوافق (alignment). وبتقديم مورد واسع النطاق، دقيق من الناحية الطبية، ومُوثّق بالكامل، تُشكّل Med-Banana-50K الأساس الحاسم لتطوير وتقدير أنظمة موثوقة لتعديل الصور الطبية.