أكثر من 1.6 مليون صورة غير مصنفة، وتقييم شامل ثلاثي الأبعاد، قام تشو يوكون وآخرون بتطوير نموذج RETFound للتنبؤ بأمراض جهازية متعددة باستخدام صور الشبكية

سواء كان الأمر يتعلق بالطباعة الحيوية ثلاثية الأبعاد في "Westworld"، أو الذراع الميكانيكية للوك سكاي ووكر في "Star Wars"، أو العالم الافتراضي الذي أنشأته الذكاء الاصطناعي في "The Matrix"، فإن الخيالات الغنية في أفلام الخيال العلمي هذه تكشف جميعها عن رغبة البشرية في الصحة وطول العمر.
اليوم، أصبحت التقنيات الطبية التي تظهر غالبًا في الأفلام، مثل الأذرع الروبوتية والذكاء الاصطناعي، حقيقة واقعة. تخيل مستقبلًا حيث يستطيع الأطباء إخبارك عن صحة قلبك والتنبؤ بخطر إصابتك بمرض باركنسون ببساطة عن طريق مسح عينيك. ألا يبدو هذا خيالًا علميًا؟ لكن هذا ليس فيلمًا، هذا شيء حقيقي.
المؤلف: تشياو تشياو
المحرر: سانيانغ
الشبكية هي الجزء الوحيد في جسم الإنسان حيث يمكن ملاحظة شبكة الشعيرات الدموية بشكل مباشر. وهو أيضًا جزء من الجهاز العصبي المركزي. غالبًا ما يقوم الذكاء الاصطناعي الطبي التقليدي بتشخيص أمراض العيون من خلال تحديد الحالات الصحية في صور شبكية العين.
لكن،يتطلب تطوير نماذج الذكاء الاصطناعي كمية كبيرة من البيانات التي يشرحها متخصصون، وعادةً ما تستهدف النماذج مهام مرضية محددة.ولا يمكن توسيعه ليشمل تطبيقات سريرية مختلفة.
ولمعالجة هذا الوضع، اقترح تشو يوكون، وهو طالب دكتوراه من كلية لندن الجامعية ومستشفى مورفيلدز للعيون، وآخرون نموذجًا أساسيًا لصورة شبكية العين يُسمى RETFound.يتم تدريبه باستخدام التعلم الذاتي على أكثر من 1.6 مليون صورة شبكية غير مصنفة.يتميز بأداء ممتاز في مهام مثل تشخيص أمراض العيون وتوقعها والتنبؤ بالأمراض الجهازية.
وقد نُشرت الورقة ذات الصلة في مجلة Nature.

احصل على الورقة:
https://www.nature.com/articles/s41586-023-06555-x
للحصول على نسخة PDF كاملة من البحث، قم بالرد بـ "retina" في حساب WeChat العام
تفاصيل تدريب نموذج RETFound
بيانات التدريب: CFP+OCT، بإجمالي أكثر من 1.64 مليون صورة
يتكون بناء مجموعة بيانات RETFound من جزأين:
* صورة CFP:إجمالي 904,170 صورة، منها 90.21 TP3T جاءت من MEH-MIDAS و9.81 TP3T جاءت من Kaggle EyePACS33
* صور OCT:إجمالي 736,442، منها 85.2% جاءت من MEH-MIDAS و14.8% جاءت من مراجع أخرى
MEH-MIDAS هي مجموعة بيانات رجعية.تم تضمين سجلات التصوير العيني الكاملة لـ 37401 مريضًا (16429 امرأة و20966 رجلاً وستة من جنس غير معروف) مصابين بمرض السكري والذين حضروا إلى مستشفى مورفيلدز للعيون في لندن بين عامي 2000 و2022.
وكان متوسط عمر هؤلاء المرضى 64.5 سنة مع انحراف معياري قدره 13.3 سنة. مع الأخذ في الاعتبار تنوع التوزيع العرقي، شمل المرضى البريطانيين (13.7%)، والهنود (14.9%)، والكاريبيين (5.2%)، والأفارقة (3.9%)، والأعراق الأخرى (37.9%) والمرضى الذين لم يكشفوا عن عرقهم (24.4%).
تأتي بيانات مجموعة بيانات MEH-MIDAS من مجموعة متنوعة من أجهزة التصوير، مثل topcon 3DOCT-2000SA (Topcon)، وCLARUS (ZEISS)، وTriton (Topcon).
تشتمل أجهزة تصوير البيانات لمجموعة بيانات EyePACS على Centervue DRS (Centervue)، وOptovue iCam (Optovue)، وCanon CR1/DGi/CR2 (Canon)، وTopcon NW (Topcon).
تم العثور عليه:النموذج الأساسي لصور الشبكية
RETFound هو نموذج أساسي لصور شبكية العين.يتم تدريبه على 1.6 مليون صورة شبكية غير مصنفة باستخدام طريقة التعلم الذاتي ويمكن تطبيقه على مهام الكشف عن الأمراض العينية والجهازية الأخرى مع تعليقات واضحة.
يتم تنفيذ نموذج RETFound باستخدام مشفر تلقائي مقنع بتكوين محدد.يتكون هذا المشفر التلقائي المقنع من جزأين:
* مشفر:نحن نستخدم محول الرؤية الكبير (ViT-large)، والذي يحتوي على 24 كتلة محول ومتجه تضمين بحجم 1024. المدخلات عبارة عن بقع غير مقنعة (16×16) ويتم عرضها في متجه مميز بحجم 1024. تتضمن كتل المحولات الـ 24 هذه انتباهًا ذاتيًا متعدد الرؤوس ومُدركًا متعدد الطبقات، والذي يقبل متجهات الميزات كمدخلات ويولد ميزات عالية المستوى.
* فك التشفير:استخدم محول الرؤية الصغيرة (Vit-small)، والذي يحتوي على 8 كتل محول ومتجه تضمين بحجم 512. يتم إدراج رقعة الدمية المقنعة في الميزات عالية المستوى المستخرجة كمدخل للنموذج، ثم يتم إعادة بناء رقعة الصورة بعد الإسقاط الخطي.

مخطط معماري لنموذج RETFound
الهدف من تدريب النموذج هو إعادة بناء الصور الشبكية من الإصدارات شديدة القناع.نسبة القناع في CFP هي 0.75، ونسبة القناع في OCT هي 0.85، وحجم الدفعة هو 1792 (8 وحدات معالجة رسومية × 224 لكل وحدة معالجة رسومية)، والعدد الإجمالي لعصور التدريب هو 800، ويتم استخدام أول 15 عصرًا للإحماء بمعدل التعلم (يزداد من 0 إلى 1×10-3 . يتم حفظ أوزان النموذج للعصر النهائي كنقطة تفتيش للتكيف مع المهام اللاحقة.
3 أبعاد لتقييم أداء نموذج RETFound
من أجل تقييم أداء وكفاءة وضع العلامات لنموذج RETFound، قام الباحثون بمقارنة نموذج RETFound مع ثلاثة نماذج أخرى مدربة مسبقًا.وهي SL-ImageNet وSSL-ImageNet وSSL-Retinal.تستخدم جميع النماذج استراتيجيات مختلفة للتدريب المسبق ولكنها تتمتع بنفس بنية النموذج وعملية الضبط الدقيق للمهام اللاحقة.
1. تشخيص أمراض العيون
استخدم الباحثون ثماني مجموعات بيانات عامة للتحقق من صحة أداء نموذج RETFound عبر مجموعة متنوعة من أمراض العيون وظروف التصوير.
التقييم الداخلي

يوضح الشكل أعلاه التقييم الداخلي، حيث يتم تطبيق النموذج المضبوط على كل مجموعة بيانات وتقييمه داخليًا على بيانات الاختبار المحجوزة في مهمة تشخيص أمراض العيون (مثل اعتلال الشبكية السكري والجلوكوما).
وتظهر النتائج التجريبية أن:حقق RETFound أفضل أداء في معظم مجموعات البيانات، بينما احتل SL-ImageNet المرتبة الثانية.
التقييم الخارجي

لإجراء التقييم الخارجي، قام الباحثون بتقييم أداء نموذج RETFound على مجموعات بيانات اعتلال الشبكية السكري (Kaggle APTOS-2019 وIDRID وMESSIDOR-2)، والتي تم شرحها على مقياس شدة اعتلال الشبكية السكري السريري الدولي المكون من 5 مستويات. يتم إجراء التقييم المتبادل بين مجموعات البيانات الثلاث، أي يتم ضبط النموذج على مجموعة بيانات واحدة وتقييمه على مجموعات البيانات الأخرى.
تظهر النتائج التجريبية أن نموذج RETFound يحقق أفضل أداء في جميع التقييمات المتبادلة.
2. تشخيص أمراض العيون
وقام الباحثون أيضًا باختبار تشخيص العين الأخرى التي تتحول إلى الضمور البقعي المرتبط بالعمر الرطب (wet-AMD) في غضون عام واحد على بيانات AlzEye.تحول:
* عندما يكون الإدخال هو CFP، يكون أداء RETFound هو الأفضل، حيث يصل AUROC إلى 0.862 (95% CI 0.86، 0.865)، وهو أفضل بشكل ملحوظ من مجموعة المقارنة؛
* عندما تم إدخال OCT، حصل RETFound على أعلى درجة مع AUROC بقيمة 0.799 (95% CI 0.796، 0.802)، مما يُظهر AUROC أعلى بشكل ملحوظ إحصائيًا من SSL-Retinal.

تظهر النتائج التجريبية أن نموذج RETFound يعمل بشكل أفضل في جميع المهام.
3. التنبؤ بالأمراض الجهازية
استخدم الباحثون أربعة أمراض جهازية لتقييم أداء نموذج RETFound في التنبؤ بالارتباط بين صور الشبكية والأمراض الجهازية.

أداء نموذج للتنبؤ بمعدل الإصابة بالأمراض الجهازية على مدى ثلاث سنوات باستخدام صور الشبكية
الأمراض الجهازية الأربعة هي: احتشاء عضلة القلب، وقصور القلب، والسكتة الدماغية الإقفارية، ومرض باركنسون.
وتظهر النتائج التجريبية أن نموذج RETFound يتفوق على نماذج المقارنة الأخرى ويحتل المرتبة الأولى في التنبؤ بأربعة أمراض.
القيود والتحديات التي تواجه نموذج RETFound
على الرغم من أن عملية البحث قامت بتقييم منهجي لدور RETFound في تشخيص وتوقع الأمراض الجهازية مثل أمراض القلب، وقصور القلب، والسكتة الدماغية، ومرض باركنسون، إلا أن هناك بعض القيود والتحديات التي تحتاج إلى مزيد من الاستكشاف في العمل المستقبلي.
أولاً، تأتي معظم البيانات المستخدمة في تطوير RETFound من المملكة المتحدة، لذا من الضروري أن نأخذ في الاعتبار التأثير الذي قد يحدثه تقديم صور شبكية العين العالمية في المستقبل على نتائج النموذج.من الضروري إدخال بيانات أكثر تنوعًا وتوازنًا في النموذج.
ثانيًا، على الرغم من أن هذه الدراسة استكشفت أداء النموذج في ظل CFP وOCT،ومع ذلك، لم تتم دراسة اندماج المعلومات المتعددة الوسائط بين CFP وOCT حتى الآن.قد يؤدي هذا إلى تحسينات إضافية في أداء RETFound.
وأخيرًا، بعض المعلومات ذات الصلة سريريًا،على سبيل المثال، التركيبة السكانية وحِدة البصر،وعلى الرغم من أنها قد تكون بمثابة متغيرات مشتركة صالحة للدراسات المتعلقة بطب العيون، إلا أنه لم يتم تضمينها بعد في نموذج SSL.
في الوقت الحالي، قام مطورو RETFound بنشر هذا النموذج للعامة، على أمل أن تتمكن المواهب من جميع أنحاء العالم من التكيف وتدريب RETFound.جعلها قابلة للتطبيق على مجموعات مختلفة من المرضى ومؤسسات الرعاية الصحية.
الذكاء الاصطناعي يساعد على تشكيل مستقبل الرعاية الصحية الذكية الجديد
حتى الآن، يعد RETFound أحد التطبيقات القليلة الناجحة للنموذج الأساسي في التصوير الطبي.وفي حين أدى ذلك إلى تحسين أداء النموذج وتقليل عبء وضع العلامات على الخبراء الطبيين، فقد أثار أيضًا انتباه الناس إلى التطبيق العملي للذكاء الاصطناعي الطبي.
تدخل الصناعة الطبية اليوم فترة من النمو الهائل في مجال الرقمنة، وقد دخلت رؤوس الأموال من مختلف الصناعات إلى السوق لتعزيز تطبيق تكنولوجيا الذكاء الاصطناعي في الصناعة الطبية.
وفقًا لإحصاءات معهد أبحاث صناعة الأعمال في الصين، في عام 2020، شكلت الرعاية الطبية AI+ 18.9% من سوق الذكاء الاصطناعي، بحجم سوق بلغ 6.625 مليار يوان. وبحسب إحصائيات IDC، فإن القيمة الإجمالية لسوق تطبيقات الذكاء الاصطناعي ستصل إلى 127 مليار دولار أميركي بحلول عام 2025، وستمثل الصناعة الطبية خمس حجم السوق. من الطبقة الأساسية إلى طبقة التطبيق، هناك الكثير مما يجب القيام به في سوق الذكاء الاصطناعي الطبي الواسع.

المصدر: معهد أبحاث الأعمال والصناعة الصيني
بالنظر إلى الأسواق الخارجية، يتم تنفيذ تطبيقات الذكاء الاصطناعي الطبي تدريجياً:في شهر مارس من هذا العام، أضافت شركة Nuance، وهي شركة برمجيات توثيق سريري مملوكة لشركة Microsoft، برنامج GPT4 إلى أحدث تطبيقات النسخ الصوتي الخاصة بها؛ في أبريل، أعلنت مايكروسوفت وإبيك أنهما ستقدمان برنامج GPT-4 من OpenAI في مجال الرعاية الصحية لمساعدة الطاقم الطبي على الاستجابة لمعلومات المرضى وتحليل السجلات الطبية؛ وفي الشهر نفسه، أعلنت شركة جوجل أنها ستطلق نموذجها الطبي الكبير Med-PaLM 2 لمجموعة المستخدمين.
وعلى الصعيد المحلي، تعمل شركة iFlytek وشركة SenseTime وشركات أخرى بشكل نشط على وضع الخطط وتسريع استكشاف تطبيقات الصناعة. لقد أصبح الذكاء الاصطناعي + الرعاية الصحية اتجاهًا توصل مجتمع التكنولوجيا العالمي إلى إجماع بشأنه.
يعتقد المطلعون على الصناعة أن تطبيق نماذج الذكاء الاصطناعي الكبيرة من المتوقع أن يخفف بشكل كبير من نقاط الألم في الصناعة الطبية. مع تعميق سيناريوهات التطبيق بشكل أكبر، من المتوقع أن يبدأ عصر الصناعة الطبية الذكية رسميًا، وتتمتع الصناعة بفرص ضخمة طويلة الأجل.
روابط مرجعية:
[1]https://www.nature.com/articles/s41586-023-06555-x
[2]https://www.nature.com/articles/d41586-023-02881-2