systematyczne pobieranie próbek jest metodą statystyczną obejmującą wybór elementów z uporządkowanej ramki pobierania próbek. Najczęstszą formą systematycznego pobierania próbek jest metoda equiprobability. W tym podejściu progresja przez Listę jest traktowana cyklicznie, z powrotem do góry po przejściu na koniec listy., Pobieranie próbek rozpoczyna się od wybrania elementu z listy losowo, a następnie wybierany jest każdy element kth w ramce, gdzie k, to przedział próbkowania( czasami znany jako skip): oblicza się to jako:
k = n n {\displaystyle k={\frac {n}{n}}}
gdzie n to wielkość próby, A N to wielkość populacji.
stosując tę procedurę każdy element w populacji ma znane i równe prawdopodobieństwo wyboru. To sprawia, że systematyczne pobieranie próbek funkcjonalnie podobne do prostego losowego pobierania próbek (SRS)., Nie jest to jednak to samo, co SRS, ponieważ nie każda możliwa próbka o określonej wielkości ma równe szanse na wybór (np. próbki z co najmniej dwoma elementami sąsiadującymi ze sobą nigdy nie zostaną wybrane przez systematyczne pobieranie próbek). Jest jednak znacznie bardziej wydajny(jeśli wariancja w systematycznej próbie jest większa niż wariancja populacji).
systematyczne pobieranie próbek ma być stosowane tylko wtedy, gdy dana populacja jest logicznie jednorodna, ponieważ systematyczne jednostki próbki są równomiernie rozmieszczone w populacji., Badacz musi upewnić się, że wybrany przedział próbkowania nie ukrywa wzorca. Każdy wzór zagrażałby przypadkowości.
przykład: załóżmy, że supermarket chce studiować nawyki zakupowe swoich klientów, a następnie za pomocą systematycznego pobierania próbek mogą wybrać co 10 lub 15 klient wchodzący do supermarketu i przeprowadzić badanie na tej próbce.
jest to losowe próbkowanie z systemem. Z ramki pobierania próbek, punkt początkowy jest wybierany losowo, a następnie wybory są w regularnych odstępach czasu. Załóżmy na przykład, że chcesz spróbować 8 domów z ulicy 120 domów., 120/8=15, więc co 15 Dom wybierany jest po losowym punkcie startowym od 1 do 15. Jeśli losowy punkt początkowy wynosi 11, to wybrane domy są 11, 26, 41, 56, 71, 86, 101, i 116. Na marginesie, jeśli co piętnasty dom był „domem narożnym”, to ten wzór narożnika może zniszczyć losowość próbki.
Jeśli, jak częściej, populacja nie jest równomiernie podzielna (Załóżmy, że chcesz spróbować 8 domów ze 125, gdzie 125/8=15.625), czy powinieneś wziąć co 15 CZY Co 16 Dom?, Jeśli weźmiesz co 16 dom, 8*16=128, więc istnieje ryzyko, że ostatni wybrany dom nie istnieje. Z drugiej strony, jeśli weźmiesz co 15 dom, 8*15=120, więc ostatnie pięć domów nigdy nie zostanie wybranych. Losowy punkt początkowy powinien być wybrany jako liczba całkowita między 0 a 15.625 (włącznie tylko z jednym punktem końcowym), aby zapewnić, że każdy dom ma równe szanse na wybranie; przedział powinien być teraz nieintegralny (15.625); a każda liczba całkowita wybrana powinna być zaokrąglona do następnej liczby całkowitej. Jeśli losowy punkt początkowy wynosi 3.,6, Następnie wybrane domy są 4, 20, 35, 50, 66, 82, 98, i 113, gdzie występują 3 interwały cykliczne po 15 i 4 interwały po 16.
aby zilustrować niebezpieczeństwo systematycznego skrywania wzoru, Załóżmy, że mamy spróbować zaplanowanej dzielnicy, w której każda ulica ma dziesięć domów w każdym bloku. W tym miejscu znajduje się nr. 1, 10, 11, 20, 21, 30… na narożnikach bloków; bloki narożne mogą być mniej wartościowe, ponieważ większa część ich powierzchni zajmuje front ulicy itp. niedostępny dla celów budowlanych., Jeśli spróbujemy co dziesiąte gospodarstwo domowe, nasza próbka będzie albo składała się tylko z domów narożnych (jeśli zaczniemy od 1 lub 10) lub nie będzie miała domów narożnych (jakikolwiek inny początek); tak czy inaczej, nie będzie reprezentatywna.
systematyczne pobieranie próbek może być również stosowane z nieporównywalnymi prawdopodobieństwami wyboru. W tym przypadku, zamiast po prostu liczyć przez elementy populacji i wybierając każdą jednostkę kth, przydzielamy każdemu elementowi przestrzeń wzdłuż linii liczbowej zgodnie z jego prawdopodobieństwem wyboru., Następnie generujemy losowy początek z równomiernego rozkładu między 0 a 1 i poruszamy się wzdłuż linii liczb w krokach 1.
przykład: mamy populację 5 jednostek (od A do E). Chcemy dać jednostce a 20% prawdopodobieństwo wyboru, jednostce B 40% prawdopodobieństwo, i tak dalej do jednostki E (100%). Zakładając, że zachowamy porządek alfabetyczny, przyporządkowujemy każdą jednostkę do następującego przedziału:
Leave a Reply