サンプリング
サンプリング一般的に用いられる推論統計手法のひとつで、対象とする母集団(Population、またはマトリックス)から個人の一部を標本(Sample)として抽出し、得られたデータをもとにその標本の一部の属性を観察することを指します。母集団の定量的な特徴により、一定の信頼性を持った推定判断が得られ、母集団の理解が達成されます。
サンプリングプロセスの主な段階:
- 母集団 (行列) を定義します。
-
サンプリングフレームを決定します。
- サンプリング方法を決定します。
- サンプルサイズを決定します。
- サンプリング計画を実施します。
- サンプリングとデータ収集。
- サンプリングプロセスを確認してください。
一般的なサンプリング方法
1) 単純なランダム サンプリング。純粋なランダム サンプリングとも呼ばれます。
母集団 N ユニットから n ユニットをサンプルとしてランダムに選択し、容量の各サンプルが同じ確率で選択されるようにします。
その特徴は、各サンプル単位が選択される確率が等しいこと、サンプルの各単位が完全に独立していること、および相互間に特定の相関や排除がないことです。単純なランダム サンプリングは、他のさまざまな形式のサンプリングの基礎となります。この方法は通常、全体のユニット間の差が小さく、数が少ない場合にのみ使用されます。
2) 系統的サンプリング。等距離サンプリングとも呼ばれます。
母集団内のすべてのユニットを特定の順序で配置し、指定された範囲内のユニットを最初のユニットとしてランダムに選択し、その後、所定のルールに従って他のサンプル ユニットを決定します。まず、初期単位として 1 から k までの数値から r をランダムに選択し、その後、r+k、r+2k... と順に他の単位を選択します。この方法は操作が簡単であり、推定精度を向上させることができます。
3) 層別サンプリング。
特定の特性またはルールに従ってサンプリング単位を異なる層に分割し、異なる層から独立してランダムにサンプルを抽出します。これにより、サンプルの構造が母集団の構造と比較的類似することが保証され、推定の精度が向上します。
4) クラスターのサンプリング。
母集団内のいくつかのユニットがグループに結合され、サンプリング中にグループが直接選択され、選択されたグループ内のすべてのユニットが調査されます。サンプリングの際には、グループのサンプリング フレームのみが必要となるため、作業負荷が簡素化されます。欠点は、推定精度が低いことです。
参考文献
【1】https://zh.wikipedia.org/wiki/sampling