التعلم التماثلي لتمثيلات المريض من البداية إلى النهاية من خلال موازنة المتغيرات الذاتية لتقدير تأثير العلاج السببي
يمكن تعريف التأثير السببي على أنه مقارنة بين النتائج الناتجة عن إجراءات بديلة اثنين أو أكثر، بحيث يتم ملاحظة زوج واحد فقط من الإجراء والنتيجة. في مجال الرعاية الصحية، يُعد التجربة العشوائية المُControlled (RCTs) المعيار الذهبي لقياس التأثيرات السببية، حيث يتم تحديد سكان الهدف بشكل صريح، ويتم تعيين كل عينة دراسية بشكل عشوائي إلى إما مجموعة العلاج أو مجموعة الضابطة. وقد أدّى الاحتمال الكبير لاستخلاص رؤى قابلة للتطبيق من العلاقات السببية إلى نمو ملحوظ في أبحاث التعلم الآلي التي تطبّق مُقدّرات التأثير السببي على البيانات الملاحظة في مجالات الرعاية الصحية والتعليم والاقتصاد. التميّز الأساسي بين الدراسات السببية التي تستخدم البيانات الملاحظة مقابل التجارب العشوائية المُControlled هو أن الدراسة تحدث بعد تطبيق العلاج، وبالتالي لا نملك سيطرة على آلية تعيين العلاج. وقد يؤدي هذا إلى فروق كبيرة في توزيع المتغيرات المرافقة بين العينات المُعالجة والضابطة، مما يجعل مقارنة التأثيرات السببية مشوّشة وغير موثوقة. وقد سعى النهج الكلاسيكي إلى حل هذه المشكلة بشكل تدريجي، من خلال التنبؤ بآلية تعيين العلاج ثم تقدير تأثير العلاج بشكل منفصل. وتوسّعت الدراسات الحديثة على جزء من هذه النهج إلى عائلة جديدة من خوارزميات التعلم التمثيلي (representation-learning)، حيث أظهرت أن الحد الأقصى لخطأ تقدير تأثير العلاج المتوقع يُحدّد بعاملين: خطأ تعميم النتيجة في التمثيل، والمسافة بين توزيعات العينات المُعالجة والضابطة التي يُولّدها التمثيل. ولتحقيق أقل تباين ممكن في تعلم هذه التوزيعات، نقترح في هذه الدراسة هدفًا ذاتي التوازن (auto-balancing) وذاتي التغذية (self-supervised) محددًا. وقد أظهرت التجارب على مجموعات بيانات حقيقية وBenchmark أن نهجنا يُنتج تقديرات أقل تحيّزًا مقارنةً بالأساليب المُنشورة مسبقًا التي تمثل الحد الأقصى الحالي من الأداء. ونُظهر أن انخفاض الخطأ يمكن تفسيره مباشرةً بقدرة التمثيل على تقليل هذا التباين بشكل صريح؛ علاوةً على ذلك، في حالات انتهاك افتراض الإيجابية (التي تحدث بكثرة في البيانات الملاحظة)، نُظهر أن أسلوبنا يتفوّق بشكل ملحوظ على الحد الأقصى السابق من الأداء. وبالتالي، وبتعلم تمثيلات تُولّد توزيعات متشابهة لمجموعتي العلاج والضابطة، نقدّم أدلة تدعم فرضية التباين في حد الخطأ، كما نقدّم نموذجًا جديدًا يُمثّل الحد الأقصى الحالي من الأداء في تقدير التأثير السببي.