A szisztematikus mintavétel egy statisztikai módszer, amely magában foglalja az elemek kiválasztását egy rendezett mintavételi keretből. A szisztematikus mintavétel leggyakoribb formája az equiprobability módszer. Ebben a megközelítésben, progresszió a listán keresztül kezeljük körkörösen, a visszatérés a csúcsra, ha a végén a lista telt el., A mintavétel úgy kezdődik, hogy véletlenszerűen kiválasztunk egy elemet a listából, majd a keret minden kth elemét kiválasztjuk, ahol k, a mintavételi intervallum( más néven skip): ezt a következőképpen számítjuk ki:
k = N {\displaystyle k = {\frac {N}{n} {n}}}}}}
ahol n A minta mérete, N pedig a populáció mérete.
ezzel az eljárással a populáció minden elemének ismert és egyenlő a szelekció valószínűsége. Ez a szisztematikus mintavételt funkcionálisan hasonlítja az egyszerű véletlenszerű mintavételhez (SRS)., Ez azonban nem ugyanaz, mint az SRS, mivel nem minden lehetséges, bizonyos méretű mintának van egyenlő esélye a kiválasztásra (például a legalább két egymás melletti elemet tartalmazó mintákat soha nem választják ki szisztematikus mintavételezéssel). Ez azonban sokkal hatékonyabb (ha variancia belül szisztematikus minta több, mint variancia populáció).
a szisztematikus mintavétel csak akkor alkalmazható, ha az adott populáció logikusan homogén, mivel a szisztematikus mintaegységek egyenletesen oszlanak el a populációban., A kutatónak biztosítania kell, hogy a kiválasztott mintavételi intervallum ne rejtse el a mintát. Bármilyen minta veszélyeztetné a véletlenszerűséget.
példa: Tegyük fel, hogy egy szupermarket tanulmányozni akarja ügyfelei vásárlási szokásait, majd szisztematikus mintavételezéssel minden 10.vagy 15. Vásárlót kiválaszthatnak a szupermarketbe belépve, és elvégezhetik a vizsgálatot ezen a mintán.
Ez véletlenszerű mintavétel egy rendszerrel. A mintavételi keretből véletlenszerűen kiválasztunk egy kiindulási pontot,majd ezt követően rendszeres időközönként választunk. Tegyük fel például, hogy 8 házat szeretne kóstolni egy 120 ház utcájából., 120/8=15, tehát minden 15. házat véletlenszerű kiindulási pont után választanak 1-15 között. Ha a véletlenszerű kiindulási pont 11, akkor a kiválasztott házak a következők 11, 26, 41, 56, 71, 86, 101, és 116. Félre, ha minden 15. ház “sarokház” volt, akkor ez a sarokmintázat elpusztíthatja a minta véletlenszerűségét.
Ha, mint gyakrabban, a lakosság nem egyenletesen osztható (tegyük fel, hogy 125-ből 8 házat szeretne mintát venni, ahol 125/8=15.625), akkor minden 15. házat vagy minden 16. házat vegyen be?, Ha minden 16. házat veszel, 8*16=128, ezért fennáll annak a veszélye, hogy az utolsó választott ház nem létezik. Másrészt, ha minden 15. házat veszel, 8*15=120, így az utolsó öt házat soha nem választják ki. A véletlenszerű kiindulási pontot ehelyett nem egész számként kell kiválasztani 0 és 15.625 között (csak egy végpontra számítva) annak biztosítása érdekében, hogy minden háznak egyenlő esélye legyen a kiválasztásra; az intervallumnak most nem integrálisnak kell lennie (15.625); és minden kiválasztott nem egész számot fel kell kerekíteni a következő egész számra. Ha a véletlenszerű kiindulási pont 3.,6, akkor a kiválasztott házak 4, 20, 35, 50, 66, 82, 98, és 113, ahol 3 ciklikus intervallum 15 és 4 intervallum 16.
a minta szisztematikus kihagyásának veszélyének szemléltetésére tegyük fel, hogy egy tervezett szomszédságot kóstolunk meg, ahol minden utcának tíz háza van minden blokkban. Ezen a helyen házak száma. 1, 10, 11, 20, 21, 30… a Blokk sarkok; sarok blokkok lehet kevésbé értékes,mivel több a terület veszi fel utcai front stb. ez építési célokra nem érhető el., Ha ezután minden 10. háztartásban mintát veszünk, akkor a minta vagy csak sarokházakból áll (ha 1 vagy 10-kor kezdjük), vagy nincs sarokház (bármilyen más indítás); akárhogy is, ez nem lesz reprezentatív.
a szisztematikus mintavétel nem egyenlő kiválasztási valószínűségekkel is használható. Ebben az esetben, ahelyett, hogy egyszerűen átszámolnánk a népesség elemeit, és kiválasztanánk minden kth egységet, minden egyes elemet egy számsor mentén osztunk ki a kiválasztási valószínűség szerint., Ezután véletlenszerű indítást generálunk egy 0 és 1 közötti egyenletes eloszlásból, majd 1 lépésben haladunk a számvonal mentén.
példa: 5 egységünk van (a-E). Azt akarjuk, hogy az A egység 20% – os kiválasztási valószínűséget adjon, a B egység 40% – os valószínűséget, és így tovább az e egységig (100%). Feltételezve, hogy ábécé sorrendet tartunk fenn, minden egységet a következő intervallumra osztunk:
Leave a Reply