استنادًا إلى البيانات السريرية من 627 مريضًا في الولايات المتحدة واليابان، تؤكد Google فعالية فحص سرطان الرئة بمساعدة الذكاء الاصطناعي في السكان

في فبراير 2024، قام المركز الوطني للسرطان بإعداد تقرير "معدل الإصابة بالسرطان والوفيات في الصين في عام 2022" بناءً على أحدث البيانات من تسجيل الأورام ومراقبة المتابعة. ويبين التقرير أن سرطان الرئة في بلدي يظل السبب الرئيسي للمرض والوفاة بسبب الأورام الخبيثة.على الرغم من أن المجتمع الطبي يولي اهتماما متزايدا لسرطان الرئة، إلا أنه لا تزال هناك العديد من المشاكل السريرية في تشخيص وعلاج سرطان الرئة، مثل التأخر في التشخيص والإفراط في العلاج.خلال العقد الماضي، قادت الذكاء الاصطناعي اتجاه التطور التكنولوجي بمعدل غير مسبوق بسبب تحسين الخوارزميات وزيادة قوة الحوسبة وتوسيع البيانات المتاحة والنمو الكبير في نطاق التطبيقات.
باعتبارها واحدة من عمالقة التكنولوجيا الأكثر تقدمًا في العالم في مجال البحث والتطوير في مجال الذكاء الاصطناعي، حققت جوجل إنجازات كبيرة في مجال أبحاث الذكاء الاصطناعي والتطبيقات الطبية. في الآونة الأخيرة، قام أتيلا كيرالي، مهندس برمجيات في Google Research، وروري بيلجريم، مدير منتج في Google Research، بدراسة كيفية قدرة نماذج التعلم الآلي على توصيل نتائجها بشكل فعال إلى أخصائيي الأشعة.لتقييم تأثير أنظمة الذكاء الاصطناعي المعممة على سير عمل فحص سرطان الرئة (LCS) في إعدادات سير العمل المحددة والأجهزة والمبادئ التوجيهية الخاصة بكل بلد وبروتوكولات التسجيل / الإدارة.تم نشر ورقة البحث في مجلة Radiology AI.
أبرز الأبحاث:
* تم تطوير وتحسين سير عمل فحص سرطان الرئة بمساعدة الذكاء الاصطناعي واختباره في الولايات المتحدة واليابان
* بمساعدة الذكاء الاصطناعي، يمكن زيادة الخصوصية بمقدار 5%-7% دون انخفاض كبير في الحساسية
* بمساعدة الذكاء الاصطناعي، يمكن تقليل متوسط وقت الفحص لكل حالة بمقدار 14 ثانية، ويتم تعزيز ثقة الطبيب في التشخيص بشكل كبير

عنوان الورقة:
https://doi.org/10.1148/ryai.230079
اتبع الحساب الرسمي وأجب "سرطان الرئة في جوجل" للحصول على ملف PDF كامل
نطاق الدراسة: الفحص بمساعدة الذكاء الاصطناعي، دراسة متعددة الجنسيات بأثر رجعي في الولايات المتحدة واليابان
استخدمت الدراسة خمس مجموعات بيانات مستقلة (DS_CA، DS_NLST، DS_US، DS_JPN) وحللت إجمالي 627 حالة تصوير مقطعي محوسب للصدر بجرعة منخفضة (بما في ذلك 141 حالة إيجابية للسرطان) في الولايات المتحدة واليابان.ومن بين هذه الدراسات، شملت الدراسة الأميركية 330 مريضا، منهم 191 رجلا و139 امرأة، ومتوسط أعمارهم 63 عاما. وشملت الدراسة اليابانية 297 مريضا، منهم 217 رجلا و80 امرأة، وبلغ متوسط أعمارهم 58 عاما. تم تعريف الحالات الإيجابية على أنها تشخيص مرضي لسرطان الرئة في غضون عامين، وتم تعريف الحالات السلبية على أنها غياب أي تشخيص مؤكد للسرطان في غضون عامين على الأقل.

في نفس الوقت،وشملت الدراسة أيضًا ستة أطباء أشعة صدرية معتمدين من مجلس الولايات المتحدة وستة أطباء أشعة يابانيين معتمدين من مجلس الولايات ولديهم خبرة في قراءة فحوصات الصدر المقطعية.وفي الدراسة، تمت مراجعة صور الأشعة المقطعية لجميع الحالات مرة واحدة من قبل 12 طبيبًا بمساعدة الذكاء الاصطناعي وبدونها، مما أسفر عن إجمالي 7254 تفسيرًا. بالنسبة لأنظمة التسجيل الخاصة بكل بلد، استخدم أخصائيو الأشعة من الولايات المتحدة نظام Lung-Rads (الإصدار 1.1) من إرشادات الكلية الأمريكية للأشعة، واستخدم أخصائيو الأشعة من اليابان نظام التسجيل Sendai.
ومن بين الحالات الـ141 الإيجابية للإصابة بالسرطان، كانت 124 حالة من الولايات المتحدة و17 حالة من اليابان. ومن بينها، أظهر وضع العقيدات للحالات الإيجابية في الولايات المتحدة وجود 69 عقيدة صلبة (56%)، و15 عقيدة صلبة جزئيًا (12%)، و20 عقيدة غير صلبة (15%)، و29 عقيدة غير مصنفة (23%).
وبالمثل، بين الحالات الإيجابية في اليابان، كانت 6 (35%) عبارة عن عقيدات صلبة، و6 (35%) عبارة عن عقيدات شبه صلبة، و5 (29%) عبارة عن عقيدات غير صلبة. ومن بين الحالات السلبية للسرطان، تم أيضًا اختيار عدد العقيدات ذات الأحجام المختلفة بحيث تتطابق نسبة الحالات السابقة مع نسبة حالات السرطان.
تحليل النموذج: بناءً على تحسين النماذج الحالية، يتم تحسين قدرات التحليل الإحصائي بشكل كبير
كانت الخطوة الأولى في البحث هي تحسين نموذج التعلم الآلي الذي تم تطويره مسبقًا باستخدام بيانات التدريب والهندسة المعمارية الإضافية.
يتكون نظام الفحص المساعد لسرطان الرئة من 13 نموذجًا يتناسقون مع بعضهم البعض. أولاً، يتم تقسيم الرئتين للحصول على تقييم شامل وتحديد ثلاث مناطق مشبوهة. ويتم بعد ذلك استخدام هذه المعلومات لتعيين تصنيف الشك لكل منطقة. يستخدم النظام Google Kubernetes Engine (GKE) المنتشر على Google Cloud لاستيعاب الصور وتشغيل نماذج التعلم الآلي وتوفير النتائج.
ببساطة، يوفر مخرجات النظام تصنيفًا للشكوك ومنطقة الاهتمام للأطباء لاتخاذ القرارات بناءً على إرشادات التسجيل في منطقتهم.

وفي الخطوة الثانية، استخدم الباحثون ثلاث مجموعات بيانات، DS_CA، وDS_US، وDS_NLST، لتطوير النموذج وتدريبه.
مجموعة التدريب:
* DS_CA هي بيانات من نظام المستشفيات الكندي، والتي تتكون من فحوصات التصوير المقطعي المحوسب التشخيصية من عام 2010 إلى عام 2017 ويتم استخدامها لتدريب نموذج التصنيف النهائي.
* تم استخدام التصوير المقطعي المحوسب غير الفحصي لمرضى DS_US للتدريب الإضافي.
* تألفت DS_NLST من 26722 مريضًا، وتم استخدام مجموعة فرعية تم الحصول عليها عن طريق التقسيم العشوائي على مستوى المريض لتطوير نظام الذكاء الاصطناعي.
مجموعة الاختبار:
* مجموعة البيانات الاختبارية الأولى هي 15% مقسمة عشوائيًا من إجمالي حالات DS_NLST.
* فحصت مجموعة بيانات الاختبار الثانية حالات التصوير المقطعي المحوسب من DS_US، وهي مجموعة بيانات من نظام مستشفى في إلينوي بالولايات المتحدة الأمريكية، وفصلت 11792 حالة مجهولة الهوية عن 5055 مريضًا.
* المجموعة الثالثة من البيانات DS_JPN هي من مستشفى Sendai Kousei، اليابان، وتتكون من 301 مريضًا خضعوا لفحص LDCT بين عامي 2006 و2018.
ولتحسين قدرة نظام الذكاء الاصطناعي على اكتشاف السرطان في مرحلة مبكرة، شملت الدراسة حالات إيجابية للسرطان cancer_in_2 لمدة تصل إلى عامين قبل التشخيص. في cancer_in_2، تمت متابعة جميع الحالات السلبية لمدة عامين على الأقل للتأكد من عدم وجود سرطان مؤكد، وتم تشخيص جميع الحالات الإيجابية عن طريق التصوير في غضون عامين.
كان الهدف الرئيسي من هذه الدراسة هو حساب الحساسية والنوعية من خلال دمج درجات مستوى الشك لدى الأطباء (LoS) للسرطان، ومسح جميع العتبات الرقمية الممكنة، واستنتاج منحنيات التشغيل المميزة للمستقبل لمستوى الشك، وحساب المساحة تحت المنحنى (AUC). كانت الأهداف الثانوية هي استكشاف حساسية / خصوصية استخدام الأطباء لأنظمة التسجيل المحلية وعتبات قرار إدارة الحالة، والتي تم حسابها على أساس عتبة ثنائية للإلحاح.
على سبيل المثال، يعتبر "متابعة الأشعة المقطعية كل 6 أشهر" أقل إلحاحًا من "متابعة الأشعة المقطعية كل 3 أشهر"، والتي بدورها أقل إلحاحًا من "الاشتباه في الإصابة بورم خبيث". وبالمثل، أجرت هذه الدراسة أيضًا نفس التحليل لاستجابة نظام التسجيل واستجابة نظام الذكاء الاصطناعي وقارنت الاختلافات في المساحة تحت المنحنى باستخدام تحليل ORH.
وفي النتائج، أشارت قيمة p < 0.05 إلى أن مقارنة الفرق في المساحة تحت المنحنى كانت ذات دلالة إحصائية، وأشارت قيمة p < 0.0125 أو < 0.01 إلى دلالة إحصائية بعد تصحيح بونفيروني، على التوالي.
نتائج الدراسة: الذكاء الاصطناعي فعال، لكنه لا يزال بإمكانه تفويت الإصابات
وفي الدراسات التي أجريت في الولايات المتحدة واليابان،وبالمقارنة بالطرق غير المدعومة، أدى مساعدة الذكاء الاصطناعي إلى زيادة حساسية جميع الأطباء في أنظمة التسجيل وخيارات إدارة الحالة.ومن بين هذه الدراسات، أظهرت الدراسات التي أجريت على حالات في الولايات المتحدة واليابان أن كل من خط البصر والمساحة تحت المنحنى تحسنا بمقدار 0.023، كما حققت مساعدة الذكاء الاصطناعي حساسية وخصوصية أعلى في جميع درجات Lung-RADS.

وكانت درجات الحساسية والنوعية أعلى في جميع فئات إدارة الحالة بمساعدة الذكاء الاصطناعي.وارتفعت خصوصية الحالات الأمريكية واليابانية بمساعدة الذكاء الاصطناعي بمقدار 5.5% و6.7% على التوالي.ومع ذلك، انخفضت خصوصية توصية الخزعة في الفحص الإيجابي بمقدار 1.1%.
وركزت الدراسة أيضًا على تحليل تعداد المرضى في تجربة فحص سرطان الرئة الوطنية الأمريكية، وأظهرت النتائج أن الخصوصية تحسنت بمقدار 3.4%. وأظهرت نتائج دراسة الحالة اليابانية أيضًا أنه بمساعدة الذكاء الاصطناعي،وفي المتوسط، يمكن تقليص وقت الفحص لكل حالة بمقدار 14 ثانية.ويعزز بشكل كبير ثقة الطبيب في التشخيص.

من حيث تحديد المواقع المساعدة، حدد نظام الذكاء الاصطناعي العقيدات التي تستحق أكبر قدر من الاهتمام في حالات سرطان 89% و75% في دراسات أجريت في الولايات المتحدة واليابان على التوالي، ولكن في حالات أخرى قد يفوت الذكاء الاصطناعي بعض العقيدات التي تستحق أكبر قدر من الاهتمام.
على سبيل المثال، في إحدى الحالات، قام الطبيب بتصنيف الحالة على أنها مشبوهة وقام نظام الذكاء الاصطناعي بتصنيفها على أنها سلبية، وأدى المزيد من المقارنة إلى تحديد عقيدات أصغر حجمًا لم يتم تشخيصها على أنها سرطان مع ما لا يقل عن عامين من المتابعة السلبية؛ وبعد مراجعة أخرى من قبل أخصائي الأشعة، بدا أنها عبارة عن أورام غدية سرطانية قليلة التوغل ويتم مراقبتها بشكل أكبر.
ختاماً،وأثبت النظام فعاليته في دراسة استرجاعية عبر بلدين، وأنظمة PACS، ومجموعات المرضى.لأن التفسير بمساعدة الذكاء الاصطناعي لحالات فحص سرطان الرئة الصعبة يقلل من المتابعة غير الضرورية ولديه القدرة على تقليل الإفراط في استخدام التصوير المتابعة، وتجنب خزعات الرئة المتكررة، وتقليل العبء على نظام الرعاية الصحية.
تستمر أبحاث جوجل حول سرطان الرئة
في الواقع، لدى جوجل تاريخ طويل في مجال الأبحاث المتعلقة بسرطان الرئة.
وفي وقت مبكر من 7 مايو 2019، أعلنت جوجل في مؤتمر المطورين لعام 2019 أن تقنية الذكاء الاصطناعي الخاصة بها يمكنها اكتشاف سرطان الرئة قبل عام واحد من الأطباء، مما يزيد من فرصة بقاء المريض على قيد الحياة بنسبة 40%. وستعمل جوجل أيضًا على تحويل هذه التقنيات إلى حلول طبية عملية لتحسين علاج وتشخيص مرضى سرطان الرئة.
بعد مرور ما يزيد قليلاً عن عشرة أيام على انتهاء مؤتمر المطورين لعام 2019، تعاون الباحث في مجال الذكاء الاصطناعي في جوجل دانييل تسي مع باحثين من جامعة ستانفورد وجامعة نيويورك ومؤسسات أخرى لنشر أحدث نموذج للتعلم العميق في مجلة Nature Medicine. وأظهرت الاختبارات أن برنامج الذكاء الاصطناعي يتمتع بمعدل دقة 94% في الحكم على الأمراض البشرية، وهو ما كان أفضل من ستة أطباء أشعة شاركوا في الاختبار، وكان لدى هؤلاء الأطباء البشريين حوالي 8 سنوات من الخبرة السريرية.
ومنذ ذلك الحين، لم تتوقف أبحاث جوجل حول سرطان الرئة. وبناءً على التطوير المستمر لنموذج التعلم الآلي المذكور أعلاه، تمكنت Google الآن أخيرًا من التحقق من فعالية النموذج في بلدان متعددة وخبراء متعددين ومرضى متعددين. وقد يعني هذا أيضًا أن التطبيق الفعلي للذكاء الاصطناعي في مجال سرطان الرئة سوف يتسارع، وسيعود بالنفع الحقيقي على البشرية في المستقبل القريب.