Command Palette
Search for a command to run...
قامت جامعة كامبريدج بتطوير جهاز لتصنيف صور خلايا الدم، حيث يساعد نموذج انتشاره في الكشف عن سرطان الدم، متجاوزًا قدرات الخبراء السريرييين.

يلعب تحليل تصوير خلايا الدم دورًا محوريًا في التشخيص السريري والبحث العلمي. فالخصائص المورفولوجية لخلايا الدم البيضاء والحمراء والصفائح الدموية لا تعكس صحة الجهاز الدموي فحسب، بل قد تكشف أيضًا عن مؤشرات مبكرة لأمراض مثل سرطان الدم ومتلازمات خلل التنسج النقوي. ومع ذلك، يعتمد التحليل المجهري اليدوي التقليدي على خبراء متمرسين في التصنيف اليدوي، وهو أمر غير فعال ويستغرق وقتًا طويلاً ويخضع للتحيز الشخصي.
في السنوات الأخيرة، ازداد تطبيق تقنية التعلم العميق في مجال تحليل الصور الطبية، وحاولت بعض الدراسات تطبيق نماذج تمييزية، وخاصةً الشبكات العصبية التلافيفية (CNNs)، لتقييم مورفولوجيا خلايا الدم. على الرغم من أن أفضل نماذج تصنيف التعلم الآلي التمييزية أداءً تُقارب الأداء البشري في تصنيف الخلايا إلى فئات مُحددة مسبقًا، إلا أنها تتعلم في المقام الأول حدود القرار بناءً على تصنيفات الخبراء. لذلك،لم يتم تصميمها بشكل طبيعي لالتقاط توزيع البيانات الكامل لشكل الخلية.ويؤدي هذا القيد إلى تقليل قدراتهم، خاصة عندما يواجهون التعقيد والتباين الكامنين في بيانات أمراض الدم السريرية.
وفي هذا السياق،اقترح فريق بحثي من جامعة كامبريدج في المملكة المتحدة تقنية CytoDiffusion، وهي طريقة لتصنيف صور خلايا الدم تعتمد على نموذج الانتشار.يمكنه نمذجة التوزيع المورفولوجي لخلايا الدم بأمانة، وتحقيق تصنيف دقيق، ولديه قدرات قوية في اكتشاف الشذوذ، ومقاومة لتحولات التوزيع، وقابلية التفسير، وكفاءة البيانات العالية، وقدرات تحديد كمية عدم اليقين التي تتجاوز قدرات الخبراء السريرييين.
يتفوق النموذج على نماذج التمييز الحديثة في اكتشاف الشذوذ (AUC: 0.990 مقابل 0.916)، والمتانة في مواجهة تحولات التوزيع (الدقة: 0.854 مقابل 0.738)، والأداء في سيناريوهات البيانات المنخفضة (الدقة المتوازنة: 0.962 مقابل 0.924).إن إطار التقييم الشامل الذي تم تطويره في هذه الدراسة يضع معيارًا متعدد الأبعاد لتحليل الصور الطبية الدموية، والذي من المتوقع أن يحسن دقة التشخيص في الإعدادات السريرية.
وقد نُشرت نتائج البحث ذات الصلة، بعنوان "التصنيف التوليدي العميق لشكل خلايا الدم"، في مجلة Nature.
أبرز الأبحاث:
* تطبيق نموذج الانتشار الكامن على تصنيف صور خلايا الدم.
* نقترح إطار عمل للتقييم يتجاوز المقاييس القياسية مثل الدقة، ودمج المتانة في تحولات التوزيع، وقدرات الكشف عن الشذوذ، والأداء في سيناريوهات البيانات المنخفضة.
* إنشاء مجموعة بيانات جديدة لصور خلايا الدم تتضمن قطعًا أثرية للتصوير وثقة المعلق، ومعالجة القيود الرئيسية لمجموعات البيانات الحالية.

عنوان الورقة:
https://www.nature.com/articles/s42256-025-01122-7
قم بمتابعة الحساب العام والرد على "الانتشار الخلوياحصل على ملف PDF كامل
عنوان مجموعة البيانات:
مزيد من أوراق البحث الرائدة في مجال الذكاء الاصطناعي:
https://hyper.ai/papers
مجموعات البيانات: الجمع بين مجموعات البيانات المتاحة للجمهور ومجموعات البيانات المصممة خصيصًا
تشكل البيانات الأساس لتحليل صور خلايا الدم وضمانة أساسية لأداء نماذج الذكاء الاصطناعي وقدرتها على التعميم. استخدم فريق CytoDiffusion خمس مجموعات بيانات، أربع منها متاحة للعامة، والأخرى عبارة عن مجموعة بيانات تم بناؤها ذاتيًا وتسمى CytoData.
مجموعة بيانات CytoData هي مجموعة بيانات مجهولة المصدر تحتوي على 2904 مسحات دم من مستشفى أدينبروك في كامبريدج، بإجمالي 559808 صورة أحادية الخلية. من بين هذه الصور، 4996 صورة مُصنّفة بعشرة أنواع من خلايا الدم، بما في ذلك الخلايا الحمراء، والحمضات، والوحيدات، والخلايا غير الناضجة. تم الحصول على الصور باستخدام نظام CellaVision DM9600، وتتضمن التعليقات التوضيحية درجات ثقة من كل خبير تعليقات توضيحية، مما يوفر مرجعًا مهمًا لتحديد كمية عدم اليقين لاحقًا. كما تتضمن CytoData فئات من البيانات المصطنعة لمعالجة التداخلات الهيكلية غير الخلوية الشائعة في مسحات الدم، وهو أمر ذو قيمة كبيرة في التطبيقات السريرية.
Raabin-WBC، PBC، Bodzas، LISC كـ 4 مجموعات بيانات عامةتتضمن مجموعة البيانات صورًا لخلايا الدم المأخوذة باستخدام مجاهر وطرق تلوين ومعدات مختلفة. يوفر Raabin-WBC قسمي الاختبار A والاختبار B؛ ويستخدم الاختبار B معدات التقاط مختلفة عن مجموعة التدريب لمحاكاة انزياح النطاق. ونظرًا لاختلاف المعدات وطرق التلوين، تُركز مجموعة بيانات LISC بشكل أكبر على قدرة النموذج على التعميم.

ومن خلال الجمع بين مجموعات البيانات متعددة المصادر هذه، لم يضمن الفريق تنوع تدريب النموذج فحسب، بل قدم أيضًا أساسًا كاملاً لتقييم الأداء عبر المجالات، واكتشاف الخلايا غير الطبيعية، واختبار النموذج في ظل ظروف ندرة البيانات.
عنوان مجموعة البيانات:
الإطار: تطبيق نموذج الانتشار على تصنيف صور خلايا الدم
يكمن الابتكار الأساسي لـ CytoDiffusion في تطبيق نموذج الانتشار على تصنيف صور خلايا الدم.على عكس النماذج التمييزية التقليدية، تمتلك نماذج الانتشار خصائص توليدية، مما يمكنها من تعلم التوزيع الكامل للصورة وتصنيفها من خلال آلية التنبؤ بالضوضاء.

مبادئ النموذج
المبدأ الأساسي لنموذج الانتشار هو تحديد عملية انتشار أمامي تُحوّل البيانات إلى توزيع شبيه بالضوضاء عن طريق إضافة ضوضاء تدريجية. ثم يتعلم النموذج عملية عكسية لإزالة الضوضاء من البيانات، وبالتالي إعادة بناء توزيع البيانات الأصلي بفعالية.
ترميز المساحة الكامنة:يتم تعيين صورة الإدخال أولاً إلى المساحة الكامنة بواسطة مشفر، ثم تتم إضافة ضوضاء غاوسية لتشكيل تمثيل كامن ضوضائي؛
الانتشار المشروط:يقوم النموذج بإنشاء تنبؤات الضوضاء لكل نوع من الخلايا ويحقق التصنيف عن طريق تقليل الخطأ بين الضوضاء المتوقعة والضوضاء الفعلية.
إزالة تدريجيا:يتم إجراء أخذ العينات التكرارية على جميع الفئات المرشحة، ويتم استبعاد الفئات المستحيلة خطوة بخطوة باستخدام اختبار t للطالب المقترن حتى يتم تحديد الفئة النهائية.
إعدادات التدريب العامة
استخدم الباحثون نموذج الانتشار المستقر 1.5 كنموذج أساسي.بالنسبة للشروط القائمة على الفئات، يتجاوز البرنامج مُرمِّز الرموز ومُشفِّر النصوص، مُوفِّرًا مُباشرةً متجهات مُرمَّزة أحادية السخونة لكل فئة. تُنسَخ هذه المتجهات رأسيًا وتُبطَّن أفقيًا لتتوافق مع مصفوفة الأبعاد المُتوقَّعة 77 × 768. استُخدِم حجم دفعة 10، ومعدل تعلُّم 10⁻⁵، وتدريب خطي من 1000 خطوة، مع التدريب على وحدة معالجة رسومية A100-80GB.
التدريب والتفكير
قام الباحثون بتطبيق مجموعة متنوعة من أساليب زيادة البيانات أثناء التدريب، بما في ذلك الانقلابات القطرية العشوائية، والدوران العشوائي (أخذ العينات الموحدة بين 0 و359 درجة)، وتذبذب اللون (السطوع = 0.25، التباين = 0.25، التشبع = 0.25، الصبغة = 0.125)، والمزج (α = 0.3، المطبق على المدخلات الشرطية بدلاً من الهدف)، وRandAugment (باستخدام المعلمات الافتراضية).
استُخدم في التدريب مُحسِّن AdamW (β1 = 0.9، β2 = 0.999، ϵ = 10⁻⁸، تناقص الوزن 0.01)، وتدريب الدقة المختلطة (fp16)، والمتوسط المتحرك الأسّي (0.9999). تم تغيير حجم جميع الصور بشكل موحد إلى 360 × 360 بكسل.
خلال مرحلة الاستدلال، طُبّقت نفس أساليب تعزيز البيانات المُستخدمة في مرحلة التدريب، ولكن استُبعدت تقنية Mixup. ونظرًا لتواجد خلايا الدم البيضاء عادةً في مركز الصورة، ولتقليل التداخل الناتج عن تعزيز مناطق حواف الصورة، حُسب خطأ الاستدلال ضمن دائرة نصف قطرها 20 بكسل فقط من مركز الصورة في المساحة الكامنة. وكانت أبعاد المساحة الكامنة 45 × 45 × 4.
عرض النتائج: يمكن أن يساعد CytoDiffusion في حل التحديات الرئيسية في النشر السريري.
إنشاء الصور والتحقق من صحتها
لا يتطلب التطبيق السريري لأنظمة الذكاء الاصطناعي أداءً عاليًا فحسب، بل يتطلب أيضًا أن تتمتع النماذج بقدرات تمثيلية موثوقة. ولإثبات قدرة CytoDiffusion على تعلم التوزيع المورفولوجي الحقيقي لخلايا الدم، بدلًا من الاعتماد على "اختصارات" كالنتائج غير الدقيقة، أجرى الباحثون اختبارًا واقعيًا.
بناءً على 32,619 صورة تدريبية، تكاد صور خلايا الدم المُولّدة بواسطة CytoDiffusion أن تكون غير قابلة للتمييز عن الصور الحقيقية. أجرى عشرة أطباء أمراض دم اختبارات تحديد الهوية على 2,880 صورة، محققين دقة إجمالية قدرها 0.523 (مستوى تخمين عشوائي)، وحساسية قدرها 0.558، وخصوصية قدرها 0.489. هذا الأداء قريب من التخمين العشوائي، مما يشير إلى أنه حتى بالنسبة للمتخصصين ذوي الخبرة، تكاد صور خلايا الدم المُولّدة بواسطة CytoDiffusion أن تكون غير قابلة للتمييز عن الصور الحقيقية.
تشير القدرة على إنشاء صور لا يمكن تمييزها تقريبًا عن الصور الحقيقية إلى أن CytoDiffusion قد تعلم بنجاح التوزيع الحقيقي لشكل خلايا الدم، كما هو موضح في الشكل أدناه:

مقارنة CytoData: تُظهر المصفوفة اليسرى نتائج CytoDiffusion، وتُظهر المصفوفة اليمنى الأداء المتوسط للخبراء البشريين.
أداء التصنيف
في أربع مجموعات بيانات (CytoDiffusion، وRaabin-WBC، وPBC، وBodzas)، حقق CytoDiffusion أداءً يفوق أداء نماذج التمييز التقليدية. وتحديدًا على CytoData، وPBC، وBodzas، حقق النموذج أداءً متطورًا، مما يُظهر أن أساليب الانتشار قادرة على مُضاهاة نماذج التمييز التقليدية أو التفوق عليها، كما هو موضح في الجدول أدناه:

إن تحديد كمية عدم اليقين يتفوق على تحديد الخبراء البشريين
تتميز الأنظمة البيولوجية بطبيعتها بعدم يقين لا يمكن اختزاله. في أي مهمة تحليلية، ينبغي ألا يركز القياس على دقة التنبؤات فحسب، بل أيضًا على عدم يقين الفاعل (سواءً كان بشريًا أو آليًا).
استخدم الباحثون تقنيات النمذجة النفسية البايزية الراسخة لاستنباط الوظيفة النفسية القياسية لانتشار الخلايا، كما هو موضح في الشكل أدناه.وتظهر النتائج أن النموذج يناسب بشكل جيد للغاية، وأن التوزيعات الخلفية لعتبة المفتاح ومعلمات العرض مضغوطة للغاية (محاور الإحداثيات المضمنة في الشكل أدناه).على الرغم من أنه لا يمكن قياسها بشكل مباشر، فإن هذه النتائج تشير إلى أن عدم اليقين في CytoDiffusion يهيمن عليه في المقام الأول عنصر الصدفة، وسلوكه يشبه إلى حد كبير سلوك المراقب المثالي.

اكتشاف الخلايا غير الطبيعية والأداء في بيئات البيانات المنخفضة
للكشف عن الخلايا الشاذة، حقق CytoDiffusion حساسية عالية (0.905) وخصوصية عالية (0.962) عند استخدام الخلايا البدائية كفئة للتشوهات في مجموعة بيانات Bodzas. في المقابل، أظهر ViT حساسية منخفضة للغاية (0.281)، مما يُظهر بوضوح عدم قدرته على تلبية متطلبات التطبيقات السريرية، كما هو موضح في الشكل أدناه:

في بيئات البيانات المنخفضة، مع 10 إلى 50 صورة تدريب فقط لكل فئة، يتفوق CytoDiffusion بشكل كبير على EfficientNetV2-M وViT-B/16، مما يدل على قدرته الفعالة على التعلم في ظل ظروف ندرة البيانات، كما هو موضح في الشكل أدناه:

قدرة التعميم النموذجي
لتقييم قدرة النموذج على التعميم، اختبر الباحثون أداءه على نطاقات بيانات مختلفة. اختُبرت النماذج المُدرَّبة على Raabin-WBC على مجموعتي بيانات Test-B (باستخدام مجاهر وكاميرات مختلفة) وLISC (باستخدام مجاهر وكاميرات وطرق تلوين مختلفة)؛ أما النماذج المُدرَّبة على CytoData، فقد اختُبرت على PBC وBodzas. وقد حقق CytoDiffusion دقةً فائقةً في جميع مجموعات البيانات الأربع.تُظهر ميزة الاتساق هذه عبر درجات متفاوتة من انحراف المجال أن CytoDiffusion قوي في مواجهة اختلافات مجموعة البيانات ويمتلك قدرة تعميم جيدة في السيناريوهات السريرية في العالم الحقيقي.
التحقق من إمكانية التفسير
من خلال تحليل خريطة الحرارة الافتراضية، يستطيع النموذج تحديد السمات المورفولوجية الرئيسية داخل الخلايا، كما هو موضح في الشكل أدناه. على سبيل المثال، عند الانتقال من الخلايا الوحيدة إلى الخلايا الحبيبية غير الناضجة، يُبرز النموذج الاختلافات في حموضة السيتوبلازم وخصائص ملء الفجوات. لا يُثبت هذا التصور قدرة النموذج على التعلم فحسب، بل يُمكن استخدامه أيضًا للكشف عن التحيزات المحتملة، مما يضمن توافق معايير التصنيف مع المنطق العلمي السريري.

لقد أثبتت نماذج الانتشار أنها رائدة في المجال الطبي الحيوي.
لا يوضح بحث CytoDiffusion إمكانات نماذج الانتشار في تصنيف مورفولوجيا خلايا الدم فحسب، بل يعكس أيضًا الارتفاع السريع لأطر العمل التوليدية القائمة على الانتشار في المجال الطبي الحيوي بأكمله، مما يُظهر قيمة رائدة في سيناريوهات تطبيق متعددة.
على سبيل المثال، غالبًا ما تكون البيانات الطبية محدودة وتواجه مخاوف كبيرة بشأن الخصوصية، مما يجعل جمع البيانات وشرحها تحديًا كبيرًا. يمكن لنماذج الانتشار معالجة هذه المشكلة من خلال توليد صور طبية اصطناعية.يساعد هذا في تدريب نماذج التعلم العميق وتحسين دقة تحليل الصور الطبية؛بالإضافة إلى إنشاء صور طبية عادية، فإنه يمكن أيضًا توسيع...يمكن أيضًا استخدام نموذج التشتت لإنشاء صور طبية لحالات محددة (مثل الأورام والكسور وما إلى ذلك).هذا مهمٌّ بشكل خاص عند تدريب نماذج التشخيص الطبي، إذ يُمكنه توفير المزيد من عينات التدريب للأمراض النادرة أو الصور التي يصعب الحصول عليها. في الوقت نفسه، تُنتج نماذج الانتشار صورًا عالية الجودة وواضحة وواقعية، مما يُحسّن دقة تشخيص الأطباء، ويُساعد أيضًا أنظمة الذكاء الاصطناعي الطبي على تقديم تنبؤات أكثر دقة.
في العديد من السيناريوهات السريرية والبحثية، يُعيق ندرة مجموعات بيانات الصور الطبية عالية الجودة إمكانات الذكاء الاصطناعي في التطبيقات السريرية. في ديسمبر 2024، كان البروفيسور كانغ تشانغ والبروفيسور جيا كو من مستشفى العيون التابع لجامعة ونتشو الطبية، والباحث جينتشو وانغ من جامعة بكين، المؤلفين المراسلين، بينما كان الدكتور كاي وانغ من جامعة بكين والدكتور يونفانغ يو من مستشفى صن يات صن التذكاري التابع لجامعة صن يات صن، المؤلفين الرئيسيين المشاركين.طُوِّر إطار عمل جديد، MINIM، يعتمد على نموذج الانتشار. يُمكِّن هذا النموذج من توليد صور طبية لمختلف وسائل التصوير لأعضاء مختلفة، بناءً على أوامر نصية.أثبتت تقييمات الأطباء والقياسات الموضوعية الدقيقة الجودة العالية للصور المُولّدة بواسطة MINIM. وفي مواجهة نطاقات بيانات غير مسبوقة، أظهر MINIM قدرات توليد مُحسّنة، مُبرزًا إمكاناته كذكاء اصطناعي طبي عام (GMAI).
عنوان الورقة:نموذج أساسي توليدي محسّن ذاتيًا لتوليد الصور الطبية الاصطناعية والتطبيقات السريرية
عنوان الورقة:https://www.nature.com/articles/s41591-024-03359-y
في أبحاث بيولوجيا الخلية، تُعدّ الخلايا الحية أنظمةً مُبدِّدةً مُعقَّدةً بعيدةً كل البعد عن التوازن الكيميائي. ولطالما كان ردُّ فعلها الجماعي للمُحفِّزات الخارجية سؤالاً علمياً جوهرياً يسعى العلماء جاهدين لاكتشافه. نوفمبر ٢٠٢٥،قامت فرق بحثية من جامعة كولومبيا وجامعة ستانفورد ومؤسسات أخرى بتطوير الإطار الحسابي Squidiff.هذا الإطار، المبني على نموذج انتشار ضمني منزوع الضوضاء مشروطًا، قادر على التنبؤ بالاستجابات النسخية في أنواع مختلفة من الخلايا تحت تأثير تحريض التمايز، واضطراب الجينات، والعلاج الدوائي. تكمن ميزته الأساسية في قدرته على دمج المعلومات الصريحة من أدوات تحرير الجينات ومركبات الأدوية: ففي التنبؤ بتمايز الخلايا الجذعية، لا يقتصر دوره على التقاط الحالات الخلوية العابرة بدقة فحسب، بل يحدد أيضًا تأثيرات اضطراب الجينات غير المضافة وخصائص الاستجابة الخاصة بكل خلية. كما طبّق فريق البحث سكويديف على أبحاث الأعضاء الوعائية، حيث نجح في التنبؤ بآثار التعرض للإشعاع على أنواع مختلفة من الخلايا، وتقييم الفعالية الوقائية للأدوية الواقية من الإشعاع.
عنوان الورقة:Squidiff: التنبؤ بالتطور الخلوي والاستجابات للاضطرابات باستخدام نموذج الانتشار
عنوان الورقة:https://www.nature.com/articles/s41592-025-02877-y
ومن المتوقع أنه مع نضج النماذج الأساسية التوليدية بشكل أكبر في المجال الطبي، سيتم تنفيذ نماذج الانتشار في سيناريوهات سريرية أكثر واقعية، لتصبح أساسًا مهمًا للاستخبارات الطبية العامة، مما يوفر موثوقية أعلى وقدرة تعميم أقوى ومساحة تطبيق أوسع لتشخيص الصور الطبية في المستقبل، والتنبؤ بالأمراض واتخاذ القرارات الذكية.
مراجع:
1.https://www.nature.com/articles/s42256-025-01122-7
2.https://www.nature.com/articles/s41592-025-02877-y
3.https://mp.weixin.qq.com/s/9JEt-QwFxngv9XC0hSIcnw
4.https://bbs.huaweicloud.com/blogs/448218








