HyperAI

جوجل تطلق إطار عمل HEAL، 4 خطوات لتقييم مدى عدالة أدوات الذكاء الاصطناعي الطبية

特色图像

إذا كنت تتخيل أن الحفاظ على حالة صحية هو بمثابة سباق، فليس كل شخص يستطيع أن يبدأ من نفس خط البداية. بعض الأشخاص يستطيعون الركض بسلاسة حتى النهاية، وبعض الأشخاص يستطيعون الحصول على المساعدة فورًا حتى لو سقطوا. ومع ذلك، قد يواجه بعض الأشخاص المزيد من العقبات بسبب ظروفهم الاقتصادية، أو مكان إقامتهم، أو مستواهم التعليمي، أو عرقهم، أو عوامل أخرى.

"المساواة في الصحة" تعني أن الجميع يجب أن يكون لديهم فرص متساوية للوصول إلى موارد الرعاية الصحية حتى يتمكنوا من إكمال هذا السباق بهدوء أكبر وتحقيق الصحة المثلى.إن المعاملة غير العادلة لبعض المجموعات (مثل الأقليات، أو الأشخاص ذوي الوضع الاجتماعي والاقتصادي المنخفض، أو الأفراد الذين لديهم وصول محدود إلى الرعاية الصحية) في الوقاية من الأمراض وتشخيصها وعلاجها يمكن أن تؤثر بشكل كبير على نوعية حياتهم وفرص بقائهم على قيد الحياة. ليس هناك شك في أن الاهتمام المتزايد بـ"المساواة في الصحة" ينبغي أن يصبح إجماعاً عالمياً من أجل معالجة الأسباب الجذرية لعدم المساواة.

في الوقت الحاضر، على الرغم من أن التعلم الآلي والتعلم العميق وما إلى ذلك قد "حققوا بعض الإنجازات" في مجال الصحة الطبية، إلا أنهم خرجوا من المختبر وانتقلوا إلى الخطوط الأمامية السريرية. عند الإعجاب بالقدرات القوية للذكاء الاصطناعي، ينبغي للناس أن ينتبهوا أكثر إلى ما إذا كان التطبيق العملي لهذا النوع من التكنولوجيا الناشئة سيؤدي إلى تفاقم عدم المساواة في الموارد الصحية؟

مخطط تقييم المساواة الصحية

*تشير الأشرطة الزرقاء الفاتحة إلى النتائج الصحية الموجودة مسبقًا

* توضح الأشرطة الزرقاء الداكنة تأثير التدخلات على النتائج الصحية الموجودة مسبقًا

ولتحقيق هذه الغاية، قام فريق جوجل بتطوير إطار عمل HEAL (إطار المساواة في الصحة)، والذي يمكنه تقييم ما إذا كانت حلول الرعاية الصحية القائمة على التعلم الآلي "عادلة" بشكل كمي.ومن خلال هذا النهج، يسعى فريق البحث إلى ضمان أن تؤدي التقنيات الصحية الناشئة إلى الحد من التفاوتات الصحية بشكل فعال، بدلاً من تفاقمها عن غير قصد.

إطار عمل HEAL: 4 خطوات لتقييم عدالة أدوات الذكاء الاصطناعي في طب الأمراض الجلدية

يتكون إطار عمل HEAL من 4 خطوات:

  1. تحديد العوامل المرتبطة بعدم المساواة في الصحة وتحديد مقاييس أداء أدوات الذكاء الاصطناعي
  2. تحديد وقياس الفوارق الصحية الموجودة مسبقًا
  3. اختبار أداء أدوات الذكاء الاصطناعي
  4. قياس إمكانات أدوات الذكاء الاصطناعي في إعطاء الأولوية للتفاوتات في المساواة الصحية
هندسة HEAL، مع الأخذ في الاعتبار أداة الذكاء الاصطناعي لتشخيص وعلاج الأمراض الجلدية كمثال

الخطوة 1: تحديد العوامل المرتبطة بعدم المساواة في مجال الصحة في مجال الأمراض الجلدية وتحديد المقاييس لتقييم أداء أدوات الذكاء الاصطناعي

قام الباحثون باختيار العوامل التالية - العمر والجنس والعرق/الانتماء العرقي ونوع بشرة فيتزباتريك (FST) - من خلال مراجعة الأدبيات والنظر في توافر البيانات.

FST هو نظام لتصنيف الجلد البشري على أساس استجابته للأشعة فوق البنفسجية (UV)، وخاصة حروق الشمس والسمرة. تتراوح أنواع التصبغات من FST I إلى FST VI، حيث يمثل كل نوع مستوى مختلفًا من إنتاج الميلانين في الجلد والعينين والشعر، بالإضافة إلى الحساسية للأشعة فوق البنفسجية.

بالإضافة إلى ذلك، اختار الباحثون أعلى 3 اتفاقات كمقياس لتقييم أداء أداة الذكاء الاصطناعي، والذي يتم تعريفه على أنه نسبة الحالات التي تطابق فيها واحد على الأقل من الحالات الثلاث الأولى التي اقترحها الذكاء الاصطناعي مع التشخيص المرجعي للجنة خبراء الأمراض الجلدية.

الخطوة 2: تحديد "التفاوتات الصحية" الموجودة في الأمراض الجلدية

مؤشرات التفاوت الصحي هي مقاييس محددة تستخدم لقياس ووصف عدم المساواة في الحالة الصحية بين المجموعات المختلفة. يتم تصنيف هذه المجموعات على أساس العرق، أو الوضع الاقتصادي، أو الموقع الجغرافي، أو الجنس، أو العمر، أو حالة الإعاقة، أو غيرها من العوامل الاجتماعية المحددة.

وفيما يلي بعض مؤشرات التفاوت الصحي الشائعة:

سنوات العمر المعدلة حسب الإعاقة (DALYs):يعكس عدد سنوات الحياة الصحية المفقودة بسبب المرض أو الإعاقة أو الوفاة المبكرة. DALY هو مؤشر مركب، وهو مجموع سنوات العمر المحتملة المفقودة (YLLs) والسنوات التي عاشها الشخص مع الإعاقة (YLDs).


سنوات العمر المفقودة (YLLs):عدد السنوات الصحية المتوقعة المفقودة بسبب الوفاة المبكرة.

وأجرى الباحثون أيضًا تحليلًا فرعيًا لسرطان الجلد لفهم كيفية اختلاف أداء أداة الذكاء الاصطناعي في ظل ظروف عالية الخطورة. لقد استخدمنا فئات العبء العالمي للأمراض (GBD) المتمثلة في "سرطان الجلد غير الميلانيني" و"الورم الميلانيني الجلدي الخبيث" لتقدير النتائج الصحية لجميع أنواع السرطان، وفئة "أمراض الجلد وتحت الجلد" لجميع الحالات غير السرطانية.

الخطوة 3: قياس أداء أدوات الذكاء الاصطناعي

تم قياس التوافق بين أفضل 3 من خلال مقارنة الأمراض المصنفة التي تنبأت بها الذكاء الاصطناعي مع التشخيصات المرجعية على مجموعة بيانات التقييم (فئات فرعية مقسمة حسب العمر والجنس والعرق/الإثنية وeFST).

الخطوة 4: اختبار أداء أدوات الذكاء الاصطناعي في مراعاة الفوارق الصحية

قم بقياس مقياس HEAL لأداة الذكاء الاصطناعي لأمراض الجلد على النحو التالي:

بالنسبة لكل مجموعة فرعية من السكان، هناك حاجة إلى مدخلين:القياسات الكمية للتفاوتات الصحية الموجودة مسبقًا وأداء أدوات الذكاء الاصطناعي.


احسب الارتباط العكسي R بين النتائج الصحية وأداء الذكاء الاصطناعي عبر جميع المجموعات الفرعية لعامل عدم المساواة المحدد (على سبيل المثال، العرق/الانتماء العرقي). كلما كانت القيمة الإيجابية لـ R أكبر، كان النظر في العدالة الصحية أكثر شمولاً.

يتم تعريف مقياس HEAL لأداة الذكاء الاصطناعي على النحو التالي: p(R > 0)، والذي يقدر احتمال إعطاء الذكاء الاصطناعي الأولوية للتفاوتات الصحية الموجودة مسبقًا من خلال توزيع R لـ 9999 عينة. إن مؤشر HEAL الذي يزيد عن 50% يعني احتمالية أعلى لتحقيق المساواة في الصحة، في حين أن مؤشر HEAL الذي يقل عن 50% يعني احتمالية أقل لتحقيق الأداء العادل.

مراجعة أداة الذكاء الاصطناعي للأمراض الجلدية: لا تزال بعض المجموعات الفرعية بحاجة إلى التحسين

العرق/الأصل العرقي: مؤشر HEAL هو 80.5%، مما يشير إلى أولوية عالية لمعالجة التفاوتات الصحية الموجودة بين هذه الفئات الفرعية.

الجنس: مؤشر HEAL هو 92.1%، مما يشير إلى أن الجنس له أولوية عالية عند النظر في الاختلافات الصحية في أداء أدوات الذكاء الاصطناعي.

العمر: مؤشر HEAL هو 0.0%، مما يشير إلى احتمالية منخفضة لإعطاء الأولوية للاختلافات الصحية بين الفئات العمرية. بالنسبة لحالة السرطان، فإن مؤشر HEAL هو 73.8%، في حين أن مؤشر HEAL للحالة غير السرطانية هو 0.0%.

مؤشرات HEAL لمختلف الفئات العمرية وللمصابين بالسرطان أو غير المصابين به

أجرى الباحثون تحليل الانحدار اللوجستي الذي أظهر أن العمر وبعض الحالات الجلدية (مثل سرطان الخلايا القاعدية وسرطان الخلايا الحرشفية) كان لها تأثير كبير على أداء الذكاء الاصطناعي، في حين كانت الحالات الأخرى (مثل الأكياس) أقل دقة.

بالإضافة إلى ذلك، أجرى الباحثون تحليلاً تقاطعيًا، باستخدام أدوات قياس نتائج الصحة المتعلقة بالأمراض العالمية المجزأة لتوسيع نطاق تحليل HEAL عبر العمر والجنس والعرق/الانتماء العرقي، مع مؤشر HEAL إجمالي قدره 17.0%.مع التركيز بشكل خاص على تقاطع التصنيفات المنخفضة في نتائج الصحة وأداء الذكاء الاصطناعي، حددنا مجموعات فرعية تحتاج إلى تحسين أداء أداة الذكاء الاصطناعي، بما في ذلك النساء من أصل إسباني في سن 50 عامًا فأكثر، والنساء السود في سن 50 عامًا فأكثر، والنساء البيض في سن 50 عامًا فأكثر، والرجال البيض الذين تتراوح أعمارهم بين 20 و49 عامًا، والرجال الأمريكيين من أصل آسيوي والمحيط الهادئ في سن 50 عامًا فأكثر.

ومع ذلك، فإن تحسين أداء أدوات الذكاء الاصطناعي لهذه المجموعات أمر بالغ الأهمية لتحقيق المساواة في مجال الصحة.

أكثر من مجرد عدالة في مجال الصحة: الصورة الأوسع لعدالة الذكاء الاصطناعي

من الواضح أن عدم المساواة في الصحة موجود بشكل كبير بين مختلف الفئات العرقية/الإثنية والجنسانية والعمرية. وخاصة مع التطور السريع لتكنولوجيا الطب العالية، فقد تفاقم اختلال التوازن في الموارد الصحية. لا يزال أمام الذكاء الاصطناعي طريق طويل لحل المشكلات ذات الصلة. ولكن تجدر الإشارة إلى أن الظلم الناجم عن التقدم التكنولوجي منتشر على نطاق واسع في جميع جوانب حياة الناس، مثل عدم المساواة في الوصول إلى المعلومات والتعليم عبر الإنترنت والخدمات الرقمية الناجمة عن الفجوة الرقمية.

قال جيف دين، رئيس الذكاء الاصطناعي في جوجل و"إله البرمجة"، ذات مرة إن جوجل تولي أهمية كبيرة لعدالة الذكاء الاصطناعي وقامت بالكثير من العمل في البيانات والخوارزميات وتحليل الاتصالات وتفسير النماذج وأبحاث الاختلافات الثقافية وحماية خصوصية النماذج الكبيرة. على سبيل المثال: * في عام 2019، أوقفت لجنة مراجعة منتجات الذكاء الاصطناعي المسؤولة ولجنة مراجعة معاملات الذكاء الاصطناعي المسؤولة في Google Cloud تطوير منتجات الذكاء الاصطناعي المتعلقة بالائتمان لتجنب تفاقم الظلم أو التحيز الخوارزمي. * في عام 2021، راجعت هيئة مراجعة التقنيات المتقدمة الأبحاث المتعلقة بنماذج اللغة الكبيرة وخلصت إلى أنه يمكن الاستمرار فيها بحذر، ولكن لا يمكن إطلاق النموذج رسميًا حتى يتم إجراء مراجعة شاملة لمبادئ الذكاء الاصطناعي. * نشر فريق Google DeepMind ذات مرة ورقة بحثية تستكشف "كيفية دمج القيم الإنسانية في أنظمة الذكاء الاصطناعي" ودمج الأفكار الفلسفية في الذكاء الاصطناعي لمساعدته على إرساء العدالة الاجتماعية.

وفي المستقبل، ولضمان عدالة تكنولوجيا الذكاء الاصطناعي، سيكون التدخل والحوكمة ضروريين من زوايا متعددة، مثل:

* جمع البيانات ومعالجتها بشكل عادل:تأكد من أن بيانات التدريب الخاصة بك تتضمن التنوع، بحيث تشمل أشخاصًا من مختلف الجنسين والأعمار والأعراق والثقافات والخلفيات الاجتماعية والاقتصادية. وفي الوقت نفسه، ينبغي تجنب اختيار البيانات بسبب التحيز لضمان تمثيلية وتوازن مجموعة البيانات.

* القضاء على التحيز الخوارزمي:أثناء مرحلة تصميم النموذج، قم بتحديد وإزالة التحيز الخوارزمي الذي قد يؤدي إلى نتائج غير عادلة بشكل استباقي. وقد يتضمن ذلك اختيارًا دقيقًا لميزات الإدخال للنموذج أو استخدام تقنيات محددة لتقليل التحيز أو القضاء عليه.

* تقييم العدالة:ينبغي إجراء تقييمات العدالة قبل وبعد نشر النموذج. ويتضمن ذلك استخدام مقاييس العدالة المختلفة لتقييم تأثير النموذج على مجموعات مختلفة وإجراء التعديلات اللازمة بناءً على نتائج التقييم.

* المراقبة المستمرة والتحسين التكراري:بعد نشر نظام الذكاء الاصطناعي، يجب مراقبة أدائه في البيئة الفعلية بشكل مستمر لتحديد وحل أي مشكلات ظلم محتملة على الفور. وقد يتطلب هذا تكرارًا منتظمًا للنماذج للتكيف مع التغيرات البيئية والمعايير الاجتماعية الجديدة.

مع تطور تكنولوجيا الذكاء الاصطناعي، سيتم تحسين المعايير الأخلاقية والقوانين واللوائح ذات الصلة بشكل أكبر، مما يسمح لتكنولوجيا الذكاء الاصطناعي بالتطور ضمن إطار أكثر عدالة. وفي الوقت نفسه، سيكون هناك تركيز أكبر على التنوع والشمول. ويتطلب هذا الأخذ بعين الاعتبار احتياجات وخصائص المجموعات المختلفة في كل جانب، بما في ذلك جمع البيانات، وتصميم الخوارزميات، وتطوير المنتجات.

وعلى المدى الطويل، ينبغي أن يكون المعنى الحقيقي لتغيير الذكاء الاصطناعي للحياة هو خدمة الناس من مختلف الجنسين والأعمار والأعراق والثقافات والخلفيات الاجتماعية والاقتصادية، والحد من الظلم الناجم عن تطبيق التكنولوجيا. مع استمرار تحسن الوعي العام، هل يمكننا إشراك المزيد من الأشخاص في التخطيط لتطوير الذكاء الاصطناعي وتقديم اقتراحات بشأن تطوير تكنولوجيا الذكاء الاصطناعي لضمان أن يكون تطوير التكنولوجيا متوافقًا مع المصالح العامة للمجتمع؟

إن الخطة الكبرى للعدالة في تكنولوجيا الذكاء الاصطناعي تتطلب جهودًا مشتركة من مجالات متعددة مثل التكنولوجيا والمجتمع والقانون. يتعين علينا أن نضمن ألا تصبح التكنولوجيا المتقدمة محركًا لـ"تأثير ماثيو".