اختبار افتراضات النموذج المناظر للأحجام الترتيبية في الانحدار اللوجستي التراتبي باستخدام الاختبار الأرجح والتقديرات المنفصلة
استكشاف نموذج الفرص النسبية للانحدار اللوجستي الترتيبي ملخص المقالة التوقيت: لم يتم تقديم تاريخ محدد للمقالة. الشخصيات الرئيسية: - رولين برانت (Rollin Brant): باحث اقترح طرقًا لاختبار فرضية الفرص النسبية في نماذج الانحدار اللوجستي الترتيبي. - بيتر ماكولاج (Peter McCullagh): أول من قدم نموذج الفرص النسبية في عام 1980. الأسباب والتطورات: تتناول المقالة نموذج الفرص النسبية للانحدار اللوجستي الترتيبي، والذي يمتد إلى حالات حيث تكون المتغير المعتمد ترتيبيًا (يتألف من قيم فئوية مرتبة). يعتمد هذا النموذج على عدة فرضيات، بما في ذلك استقلالية المشاهدات، خطيّة الأوبس، غياب التعددية بين المتغيرات المستقلة (المحولات)، وفرضية الفرص النسبية. هذه الفرضية الأخيرة تشير إلى أن معاملات الانحدار تكون ثابتة عبر جميع العتبات للمتغير المعتمد الترتيبي. النتائج: تقدم المقالة طرقًا مختلفًا لتقييم مدى صحة فرضية الفرص النسبية، مع التركيز على طريقتين اقترحهما برانت في مقالته عام 1990. تشمل هذه الطرق اختبار نسبة الاحتمال واختبار التكيفات المنفصلة. يتم تطبيق هذه الطرق باستخدام لغة برمجة Python على بيانات حقيقية من مجموعة بيانات جودة النبيذ. 1. مقدمة إلى نموذج الفرص النسبية في هذا القسم، يتم تقديم هيكل البيانات وتعريف نموذج الفرص النسبية. يفترض أن لدينا N مشاهدة مستقلة، وكل مشاهدة تمثلها متجهة من p متغيرات مفسرة Xi = (Xi1, Xi2, ..., Xip)، مع متغير معتمد Y يأخذ قيمًا ترتيبية من 1 إلى K. يتم صياغة نموذج الفرص النسبية كما يلي: [ \text{logit}(\gamma_j) = \log\left(\frac{\gamma_j}{1 - \gamma_j}\right) = \theta_j - \beta^T X_i ] حيث (\theta_j) هي العتبات لكل فئة j، و(\beta) هو متجهة معاملات الانحدار التي تكون ثابتة لجميع الفئات. يُلاحظ وجود اتجاه متوالي في معاملات (\theta_j) عبر فئات المتغير المعتمد Y. 2. تقييم فرضية الفرص النسبية: اختبار نسبة الاحتمال برانت (1990) يقترح استخدام اختبار نسبة الاحتمال لتقييم فرضية الفرص النسبية. يبدأ هذا النهج بتطابق نموذج أقل تقييدًا يسمح بوجود معاملات انحدار مختلفة لكل فئة. يتم تعريف هذا النموذج كما يلي: [ \text{logit}(\gamma_j) = \theta_j - \beta_j^T X_i ] حيث (\beta_j) هي متجهة معاملات الانحدار لكل فئة j. ثم يتم استخدام اختبار نسبة الاحتمال لمقارنة هذا النموذج غير المقيد (غير النسبي أو المتشبع) مع النموذج المقيد (الفرص النسبية أو المختزل). اختبار نسبة الاحتمال يتم تعريفه كالتالي: [ \lambda = -2 \log\left(\frac{L(\hat{\theta}_0)}{L(\hat{\theta})}\right) ] حيث (L(\hat{\theta})) هي دالة الاحتمال تحت النموذج الكامل، و(L(\hat{\theta}_0)) هي دالة الاحتمال تحت النموذج المقيد. يتبع اختبار نسبة الاحتمال توزيعًا مربع كاي مع درجات حرية تساوي الفرق في عدد المعلمات بين النموذجين. 3. تقييم فرضية الفرص النسبية: نهج التكيفات المنفصلة في هذا القسم، يتم شرح مفهوم المسافة الماهالانوبيس (Mahalanobis distance)، وهي تستخدم لقياس الاختلاف بين متجهتين في فضاء متعدد المتغيرات يشترك في نفس التوزيع. يتم بناء نموذج انحدار لوجستي ثنائي منفصل لكل عتبة من العتبات j = 1, 2, ..., K-1 للمتغير المعتمد الترتيبي Y. يتم تعريف المتغير الثنائي Zj كما يلي: [ Z_j = \begin{cases} 1 & \text{إذا كانت المشاهدة تتجاوز العتبة } j \ 0 & \text{خلاف ذلك} \end{cases} ] ثم يتم اختبار فرضية أن معاملات الانحدار (\beta_j) تكون متساوية عبر جميع النماذج الثنائية. هذا يعادل اختبار الفرضية التالية: [ H_0 : \beta_1 = \beta_2 = \cdots = \beta_{K-1} ] يتم حساب الإحصائي والد (Wald statistic) الذي يمكن تفسيره كمسافة ماهالانوبيس بين متجهة الاختلافات (\Delta \beta) والمتجهة الصفرية. يتبع الإحصائي والد توزيعًا مربع كاي مع درجات حرية تساوي ((K-2) \times p). 4. أمثلة: تطبيق الطريقتين لاختبار الفرص النسبية استخدمت المقالة مجموعة بيانات "جودة النبيذ" كمثال، والتي تشتمل على معلومات عن عينات النبيذ الأحمر وتصنيفات جودتها. تم دمج الفئات 3 و4 في فئة واحدة (ملصقة بـ4)، والفئات 7 و8 في فئة واحدة (ملصقة بـ7) لضمان وجود عدد كافٍ من المشاهدات في كل مجموعة. تم التعامل مع القيم الشاذة في المتغيرات المستقلة باستخدام طريقة النطاق الربيعي (IQR). تم اختيار ثلاثة محولات—الحموضة المتقلبة، ثاني أكسيد الكبريت الحر، وثاني أوكسيد الكبريت الإجمالي—وتقييمها في نموذج الانحدار اللوجستي الترتيبي بعد تعييرها. تم تطبيق اختبار نسبة الاحتمال واختبار التكيفات المنفصلة على البيانات. أنتج اختبار نسبة الاحتمال قيمة إحصائية تساوي 53.207 بقيمة p تساوي (1.066 \times 10^{-9})، مما يشير إلى رفض فرضية Null عند مستوى الدلالة 5%. كما أنتج اختبار التكيفات المنفصلة قيمًا مماثلة، مما أكد عدم صحة فرضية الفرص النسبية. الخاتمة كان لهذه المقالة هدفين رئيسيين: أولًا، توضيح كيفية اختبار فرضية الفرص النسبية في سياق الانحدار اللوجستي الترتيبي، وثانيًا، تشجيع القراء على استكشاف مقالة برانت (1990) لفهم أعمق للموضوع. يقدم برانت أيضًا طرقًا لتقييم كفاءة نموذج الانحدار اللوجستي الترتيبي بشكل عام، مثل اختبار ما إذا كان المتغير الكامن Y* يتبع توزيعًا لوجستيًا أو ما إذا كان هناك دالة ربط بديلة أكثر ملاءمة. تقييم الحدث من قبل المختصين يرى المختصون أن اختبارات فرضية الفرص النسبية، مثل اختبار نسبة الاحتمال واختبار التكيفات المنفصلة، تعتبر أدوات مهمة لضمان صحة وقابلية تفسير نماذج الانحدار اللوجستي الترتيبي. هذه الاختبارات تساعد الباحثين في تحديد ما إذا كان النموذج المقيد (الفرص النسبية) ملائمًا للبيانات، وبالتالي تضمن صحة النتائج والتفسيرات المستخلصة من النموذج. نبذة تعريفية عن الشركة ذات الصلة لم يتم ذكر أي شركة في المقالة، لكن المقالة تعتمد على مكتبات Python مثل pandas وmatplotlib وseaborn وplotly وstatsmodels لتنفيذ التحليلات والاختبارات الإحصائية. هذه المكتبات تقدم أدوات قوية ومرنة لتحليل البيانات وبناء النماذج الإحصائية، مما يجعلها اختيارًا مثاليًا للمحللين والمطورين في مجالات العلوم البيانات والتعلم الآلي والإحصاء. مراجع Brant, Rollin. 1990. “Assessing Proportionality in the Proportional Odds Model for Ordinal Logistic Regression.” Biometrics, 1171–78. McCullagh, Peter. 1980. “Regression Models for Ordinal Data.” Journal of the Royal Statistical Society: Series B (Methodological) 42 (2): 109–27. Wasserman, L. (2013). All of Statistics: A Concise Course in Statistical Inference. Springer Science & Business Media. Cortez, P., Cerdeira, A., Almeida, F., Matos, T., & Reis, J. (2009). Wine Quality [Dataset]. UCI Machine Learning Repository. https://doi.org/10.24432/C56S3T.