HyperAI

プロポーショナルオッズモデルによる順序ロジスティック回帰の評価プロポーショナルオッズモデルは、順序尺度で測定された依存変数を持つ回帰分析問題に対する解決策として、1980年にMcCullaghによって导入されました。このモデルは、二値ロジスティック回帰の拡張版であり、依存変数が順序のあるカテゴリ値を取る場合に使用されます。モデルの主要な前提としては、観察の独立性、対数オッズの線形性、説明変数間の多重共線性の不存在、および最も重要なプロポーショナルオッズ仮定があります。プロポーショナルオッズ仮定は、すべての閾値に対して回帰係数が一定であることを述べています。この仮定を確認することは、モデルの妥当性和解釈可能性を保証するために重要です。本論文では、Brant (1990)によって提出された2つのアプローチに重点を置いて、プロポーショナルオッズ仮定の評価方法を詳しく説明します。それぞれの手法は、Pythonを使用して実際のデータに適用される具体例を含んでいます。 1. プロポーショナルオッズ模型の導入データ構造に関して、N個の独立した観察データが存在すると仮定します。各観察は、p個の説明変数 ( X_i = (X_{i1}, X_{i2}, \ldots, X_{ip}) ) と、1からKまでの順序付きカテゴリ値Yから成る応答変数で表されます。このモデルでは、応答変数Yの累積分布確率 ( \gamma_j = P(Y \leq j | X_i) ) を、説明変数の関数として表現します。具体的な式は以下の通りです： [ \text{logit}(\gamma_j) = \log\left(\frac{\gamma_j}{1 - \gamma_j}\right) = \theta_j - \beta^T X_i \quad \text{for } j = 1, 2, \ldots, K-1 ] ここで、( \theta_j ) は各カテゴリjの切片を表し、( \theta_1 < \theta_2 < \cdots < \theta_{K-1} ) という条件を満たします。また、( \beta ) はすべてのカテゴリに対して同じ回帰係数を表すベクトルです。これは、潜在変数 ( Y^ ) の存在を仮定して導かれます。潜在変数 ( Y^ ) は以下のように定義されます： [ Y^* = \beta^T X_i + \epsilon ] ここで、( \epsilon ) は通常、標準ロジスティック分布に従うノイズを表します。潜在変数 ( Y^* ) は、閾値 ( \theta_j ) によって区切られ、観測された順序変数Yを生成します。 2. ライクリフツ比検定法によるプロポーショナルオッズ仮定の評価 Brant (1990)は、ライクリフツ比検定法を使用してプロポーショナルオッズ仮定を評価することを提案しています。まず、すべてのカテゴリで異なる回帰係数を持つ制約のないモデルをフィットさせ、次にこれが制約のある（プロポーショナルオッズ）モデルと比較されます。制約のないモデルの式は以下の通りです： [ \text{logit}(\gamma_j) = \theta_j - \beta_j^T X_i \quad \text{for } j = 1, \ldots, K-1 ] ここで、( \beta_j ) は各カテゴリjに対するp次元の回帰係数ベクトルです。このモデルは、プロポーショナルオッズ仮定を満たしていないと見なされます。仮説検定の手順は以下の通りです：帰無仮説 ( H_0 ): 全てのカテゴリに対して ( \beta_j = \beta ) 代替仮説 ( H_1 ): 少なくとも1つのカテゴリに対して ( \beta_j \neq \beta ) ライクリフツ比統計量は、次のように定義されます： [ \lambda = -2 \log \left(\frac{\mathcal{L}(\hat{\theta}_0; x)}{\mathcal{L}(\hat{\theta}; x)}\right) ] ここで、 ( \mathcal{L}(\hat{\theta}_0; x) ) は制約のあるモデル（帰無仮説下）の最尤推定値、 ( \mathcal{L}(\hat{\theta}; x) ) は制約のないモデル（フルモデル）の最尤推定値を表します。 3. 別々の適合によるプロポーショナルオッズ仮定の評価 Brantは、マルチコレスponding binary logistic regression models to test the proportional odds assumption. 具体的に、次のステップを踏みます：応答変数 ( Y ) の各閾値 ( j = 1, 2, \ldots, K-1 ) について、二値ロジスティック回帰モデルを別々に適合させます。二値モデル ( Z_j ) の回帰係数 ( \beta_j ) が全て等しいかどうかをテストします。この手順は、以下のように表されます：応答変数 ( Y ) の各閾値 ( j ) において、二値変数 ( Z_j ) を ( Z_j = 1 ) と ( Z_j = 0 ) に分割します。二値モデルの回帰係数の差をMahalanobis距離を用いて評価します。 4. 実際のデータへの適用使用されるデータは、「ワイン品質」データセットで、1,599の観察データと12変数を含んでいます。ターゲット変数「品質」は順序変数で、元の範囲は3から8ですが、3と4を4に、7と8を7に統合して4つのレベルにします。説明変数の外れ値はIQR法を用いて処理し、揮発酸、フリー硫酸二酸化硫黄、総硫酸二酸化硫黄の3つの予測子を選び、標準化します。結果: - ライクリフツ比検定: - 検定統計量 ( LR = 53.207 ) - p値 ( 1.066 \times 10^{-9} ) - 自由度: 6 Wald検定: 検定統計量 ( X^2 = 41.880 ) p値 ( 1.232 \times 10^{-7} ) 自由度: 6 両方の検定結果は、p値が5%の有意水準を下回ることから、プロポーショナルオッズ仮定が違反していることを示唆しています。業界関係者のコメントこの研究は、順序ロジスティック回帰モデルの評価において重要な洞察を提供しています。Brantの方法は、モデル適合性の全体的な評価だけでなく、特定の予測子が仮定の違反の主因かどうかをより詳細に分析するための手段も提供しています。これは、データ解析におけるより深い理解と信頼性向上に寄与するでしょう。本論文は、ブラン（1990）の原著を参照することを読者に強く奨励しています。その中には、潜在変数 ( Y^* ) がロジスティック分布を実際に seguir しているかどうかをテストする方法など、さらに多くの評価手法が含まれています。参照文献 Brant, R. (1990): "Assessing Proportionality in the Proportional Odds Model for Ordinal Logistic Regression." Biometrics, 1171–78. McCullagh, P. (1980): "Regression Models for Ordinal Data." Journal of the Royal Statistical Society: Series B (Methodological) 42 (2): 109–27. Wasserman, L. (2013): "All of Statistics: A Concise Course in Statistical Inference." Springer Science & Business Media. Cortez, P., Cerdeira, A., Almeida, F., Matos, T., & Reis, J. (2009): Wine Quality Dataset. UCI Machine Learning Repository. https://doi.org/10.24432/C56S3T. 本稿は、順序ロジスティック回帰モデルでのプロポーショナルオッズ仮定の評価方法を詳しく説明し、Pythonによる具体例を提供しました。データ科学者、機械学習エンジニア、または統計学に背景を持つ読者にとって、この仮定の検証方法が理解できるようになっています。Brantの方法を参照することで、より詳細な分析も可能となり、モデルの正確性を高めるための貴重なツールとなります。

関連リンク

関連リンク

関連リンク

視覚的現実を超えて：清華ワールドアリーナの新しい評価システムが具現化された世界モデルの能力ギャップを明らかにする

視覚的現実を超えて：清華ワールドアリーナの新しい評価システムが具現化された世界モデルの能力ギャップを明らかにする

Command Palette

関連リンク

Command Palette

関連リンク

Command Palette

関連リンク

視覚的現実を超えて：清華ワールドアリーナの新しい評価システムが具現化された世界モデルの能力ギャップを明らかにする

視覚的現実を超えて：清華ワールドアリーナの新しい評価システムが具現化された世界モデルの能力ギャップを明らかにする