体系的なサンプリングは、順序付けられたサンプリングフレームから要素の選択を含む統計的方法です。 体系的なサンプリングの最も一般的な形式は、等確率法です。 このアプローチでは、リストの進行は循環的に処理され、リストの終わりが渡されると先頭に戻ります。, サンプリングは、リストからランダムに要素を選択することから始まり、フレーム内のすべてのk番目の要素が選択されます。kはサンプリング間隔(スキップとしても知られています)です。
k=N n{\displaystyle k={\frac{N}{n}}}
ここで、nはサンプルサイズ、Nは母集団サイズです。
この手順を使用すると、母集団内の各要素は、選択の既知かつ等しい確率を有する。 これにより、体系的なサンプリングは単純無作為抽出(SRS)と機能的に類似しています。, しかし、特定のサイズのすべての可能なサンプルが選択される可能性が等しいわけではないため、SRSと同じではありません(例えば、少なくとも二つの しかし、それははるかに効率的です(体系的なサンプル内の分散が母集団の分散よりも大きい場合)。
体系的なサンプリングは、体系的なサンプル単位が母集団に一様に分布しているため、与えられた母集団が論理的に均質である場合にのみ適用, の研究者を確保するためには、選択したサンプリング間隔のない非表示パターンです。 任意のパターンを脅かすよう乱数の発生.
例:スーパーマーケットが顧客の購買習慣を研究したいとし、体系的なサンプリングを使用して、スーパーマーケットに入るすべての10番目または15番目の顧客
これはシステムによる無作為抽出です。 サンプリングフレームから、開始点がランダムに選択され、その後の選択肢は一定の間隔で選択されます。 たとえば、8軒の家屋の通りから120軒の家屋をサンプリングするとします。, 120/8=15なので、すべての15家は、1と15の間のランダムな出発点の後に選択されます。 ランダムな開始点が11の場合、選択された家は次のとおりです11, 26, 41, 56, 71, 86, 101, そして116 余談ですが、すべての15番目の家が”角の家”であった場合、この角のパターンはサンプルのランダム性を破壊する可能性があります。
より頻繁に人口が均等に割り切れない場合(8つの家のうち125をサンプリングしたいと仮定し、125/8=15.625)、15th家ごとまたは16th家ごとに取るべきで, あなたがすべての16番目の家を取る場合、8*16=128なので、最後に選ばれた家が存在しないというリスクがあります。 一方、15番目の家ごとに8*15=120を取ると、最後の五つの家は決して選択されません。 ランダムな開始点は、代わりに0と15.625の間の非整数として選択する必要があります(一つの端点のみを含む)すべての家が選択される確率が等しいことを保証するために、間隔は非整数(15.625)になり、選択された非整数はそれぞれ次の整数に切り上げられるべきです。 ランダムな開始点が3の場合。,6、その後、選択された家は次のとおり4, 20, 35, 50, 66, 82, 98, および113は、3つの周期間隔が15および4つの間隔が16ある。
パターンを隠す体系的なスキップの危険性を説明するために、各通りに各ブロックに十軒の家がある計画された近所をサンプリングするとします。 この場所の家No.1, 10, 11, 20, 21, 30… ブロック隅;コーナーブロックがあることがある貴重なら、彼らはよりフロント等 それは建物の目的のために利用できません。, その後、10世帯ごとにサンプリングする場合、サンプルはコーナーハウスのみで構成され(1または10から始まる場合)、コーナーハウスがない(他のスタート)。
体系的なサンプリングは、等しくない選択確率で使用することもできます。 この場合、単に母集団の要素を数えてすべてのk番目の単位を選択するのではなく、その選択確率に従って各要素に数直線に沿ったスペースを割り当, 次に、0と1の間の一様分布からランダムな開始を生成し、1のステップで数直線に沿って移動します。
例:私たちは5単位(aからE)の母集団を持っています。 ユニットAに20%の選択確率、ユニットBに40%の確率などを与え、ユニットE(100%)まで与えたいとします。 アルファベット順を維持すると仮定して、各ユニットを次の間隔に割り当てます。
Leave a Reply