Il campionamento sistematico è un metodo statistico che comporta la selezione di elementi da un quadro di campionamento ordinato. La forma più comune di campionamento sistematico è un metodo di equiprobabilità. In questo approccio, la progressione attraverso l’elenco viene trattata circolarmente, con un ritorno in alto una volta superata la fine dell’elenco., Il campionamento inizia selezionando un elemento dalla lista a caso e poi ogni kth elemento è selezionata la cornice, dove k è l’intervallo di campionamento (a volte conosciuto come il salto): è calcolato come:
k = N n {\displaystyle k={\frac {N}{n}}}
dove n è la dimensione del campione, e N è la dimensione della popolazione.
Utilizzando questa procedura ogni elemento nella popolazione ha una probabilità di selezione nota e uguale. Ciò rende il campionamento sistematico funzionalmente simile al campionamento casuale semplice (SRS)., Tuttavia non è lo stesso di SRS perché non tutti i possibili campioni di una certa dimensione hanno le stesse possibilità di essere scelti (ad esempio campioni con almeno due elementi adiacenti l’uno all’altro non saranno mai scelti mediante campionamento sistematico). È tuttavia molto più efficiente (se la varianza all’interno del campione sistematico è superiore alla varianza della popolazione).
Il campionamento sistematico deve essere applicato solo se la popolazione data è logicamente omogenea, poiché le unità di campionamento sistematiche sono distribuite uniformemente sulla popolazione., Il ricercatore deve assicurarsi che l’intervallo di campionamento scelto non nasconda un modello. Qualsiasi schema minaccerebbe la casualità.
Esempio: Supponiamo che un supermercato voglia studiare le abitudini di acquisto dei propri clienti, quindi utilizzando un campionamento sistematico possono scegliere ogni 10 ° o 15 ° cliente che entra nel supermercato e condurre lo studio su questo campione.
Questo è un campionamento casuale con un sistema. Dal frame di campionamento, un punto di partenza viene scelto a caso e le scelte successive sono a intervalli regolari. Ad esempio, supponiamo di voler campionare 8 case da una strada di 120 case., 120/8=15, quindi ogni 15a casa viene scelta dopo un punto di partenza casuale tra 1 e 15. Se il punto di partenza casuale è 11, le case selezionate sono 11, 26, 41, 56, 71, 86, 101, e 116. Per inciso, se ogni 15a casa fosse una “casa d’angolo”, questo modello d’angolo potrebbe distruggere la casualità del campione.
Se, come più frequentemente, la popolazione non è equamente divisibile (supponiamo di voler campionare 8 case su 125, dove 125/8=15.625), dovresti prendere ogni 15a casa o ogni 16a casa?, Se prendi ogni 16a casa, 8 * 16=128, quindi c’è il rischio che l’ultima casa scelta non esista. D’altra parte, se prendi ogni 15a casa, 8*15=120, quindi le ultime cinque case non saranno mai selezionate. Il punto di partenza casuale dovrebbe invece essere selezionato come un non intero tra 0 e 15.625 (incluso solo su un endpoint) per garantire che ogni casa abbia le stesse possibilità di essere selezionata; l’intervallo dovrebbe ora essere non integrale (15.625); e ogni non intero selezionato dovrebbe essere arrotondato al numero intero successivo. Se il punto di partenza casuale è 3.,6, quindi le case selezionate sono 4, 20, 35, 50, 66, 82, 98, e 113, dove ci sono 3 intervalli ciclici di 15 e 4 intervalli di 16.
Per illustrare il pericolo di un salto sistematico che nasconde un modello, supponiamo di provare un quartiere pianificato in cui ogni strada ha dieci case su ogni blocco. Questo luoghi case No. 1, 10, 11, 20, 21, 30… sugli angoli del blocco; i blocchi d’angolo possono essere meno preziosi, poiché più della loro area è occupata dal fronte della strada, ecc. che non è disponibile per scopi di costruzione., Se poi campioniamo ogni 10a famiglia, il nostro campione sarà costituito solo da case d’angolo (se iniziamo da 1 o 10) o non avrà case d’angolo (qualsiasi altro inizio); in entrambi i casi, non sarà rappresentativo.
Il campionamento sistematico può essere utilizzato anche con probabilità di selezione non uguali. In questo caso, piuttosto che semplicemente contare attraverso elementi della popolazione e selezionando ogni unità kth, assegniamo ad ogni elemento uno spazio lungo una linea numerica in base alla sua probabilità di selezione., Generiamo quindi un inizio casuale da una distribuzione uniforme tra 0 e 1 e ci spostiamo lungo la linea numerica a passi di 1.
Esempio: Abbiamo una popolazione di 5 unità (da A a E). Vogliamo dare all’unità A una probabilità del 20% di selezione, all’unità B una probabilità del 40% e così via fino all’unità E (100%). Supponendo di mantenere l’ordine alfabetico, assegniamo ogni unità al seguente intervallo:
Leave a Reply