l’échantillonnage systématique est une méthode statistique qui consiste à sélectionner des éléments à partir d’une base d’échantillonnage ordonnée. La forme la plus courante d’échantillonnage systématique est une méthode d’équiprobabilité. Dans cette approche, la progression à travers la liste est traitée circulairement, avec un retour en haut une fois la fin de la liste passée., L’échantillonnage commence par sélectionner un élément de la liste au hasard, puis chaque kème élément de la trame est sélectionné, où k, est l’intervalle d’échantillonnage (parfois appelé saut): ceci est calculé comme suit:
k = N n {\displaystyle k={\frac {n}{n}}}
où n est la taille de l’échantillon et N est la taille de la population.
en utilisant cette procédure, chaque élément de la population a une probabilité de sélection connue et égale. Cela rend l’échantillonnage systématique fonctionnellement similaire à l’échantillonnage aléatoire simple (SRS)., Cependant, ce n’est pas la même chose que SRS car tous les échantillons possibles d’une certaine taille n’ont pas les mêmes chances d’être choisis (par exemple, les échantillons avec au moins deux éléments adjacents l’un à l’autre ne seront jamais choisis par échantillonnage systématique). Il est cependant beaucoup plus efficace (si la variance au sein de l’échantillon systématique est supérieure à la variance de la population).
l’échantillonnage systématique ne doit être appliqué que si la population donnée est logiquement homogène, car les unités d’échantillonnage systématiques sont uniformément réparties sur la population., Le chercheur doit s’assurer que l’intervalle d’échantillonnage choisi ne cache pas de motif. Tout modèle menacerait le hasard.
exemple: supposons qu’un supermarché veuille étudier les habitudes d’achat de ses clients, puis en utilisant un échantillonnage systématique, il peut choisir chaque 10ème ou 15ème client entrant dans le supermarché et mener l’étude sur cet échantillon.
C’est l’échantillonnage aléatoire avec un système. À partir de la base d’échantillonnage, un point de départ est choisi au hasard, puis les choix se font à intervalles réguliers. Par exemple, supposons que vous souhaitiez échantillonner 8 maisons dans une rue de 120 maisons., 120/8=15, donc chaque 15ème maison est choisie après un point de départ aléatoire entre 1 et 15. Si le point de départ aléatoire est 11, les maisons sélectionnées sont 11, 26, 41, 56, 71, 86, 101, et 116. En aparté, si chaque 15e maison était une « maison d’angle », ce motif d’angle pourrait détruire le caractère aléatoire de l’échantillon.
Si, comme le plus souvent, la population n’est pas uniformément divisible (supposons que vous souhaitiez échantillonner 8 maisons sur 125, où 125/8=15,625), devriez-vous prendre chaque 15e maison ou chaque 16e maison?, Si vous prenez chaque 16ème maison, 8*16=128, Il y a donc un risque que la dernière maison choisie n’existe pas. D’autre part, si vous prenez chaque 15ème maison, 8*15=120, donc les cinq dernières maisons ne seront jamais sélectionnées. Le point de départ aléatoire doit plutôt être sélectionné comme un non entier compris entre 0 et 15,625 (inclus sur un seul point final seulement) pour s’assurer que chaque maison a des chances égales d’être sélectionnée; l’intervalle doit maintenant être non intégral (15,625); et chaque Non entier sélectionné doit être arrondi à l’entier suivant. Si le point de départ aléatoire est 3.,6, puis les maisons sélectionnées sont 4, 20, 35, 50, 66, 82, 98, et 113, où il y a 3 intervalles cycliques de 15 et 4 intervalles de 16.
pour illustrer le danger d’un saut systématique dissimulant un modèle, supposons que nous devions échantillonner un quartier planifié où chaque rue a dix maisons sur chaque bloc. Cet endroit abrite no. 1, 10, 11, 20, 21, 30… sur les coins des blocs; les blocs d’angle peuvent être moins précieux, car une plus grande partie de leur surface est occupée par le front de rue, etc. ce n’est pas disponible à des fins de construction., Si nous échantillonnons ensuite chaque 10e ménage, notre échantillon sera composé uniquement de maisons d’angle (si nous commençons à 1 ou 10) ou n’aura pas de maisons d’angle (tout autre début); de toute façon, il ne sera pas représentatif.
l’échantillonnage systématique peut également être utilisé avec des probabilités de sélection non égales. Dans ce cas, plutôt que de simplement compter à travers les éléments de la population et de sélectionner chaque kème unité, nous allouons à chaque élément un espace le long d’une ligne numérique en fonction de sa probabilité de sélection., Nous générons ensuite un départ aléatoire à partir d’une distribution uniforme entre 0 et 1, et nous nous déplaçons le long de la ligne numérique par Pas de 1.
exemple: nous avons une population de 5 unités (A à E). Nous voulons donner à l’unité A une probabilité de sélection de 20%, à l’unité B une probabilité de 40%, et ainsi de suite jusqu’à l’unité E (100%). En supposant que nous maintenons l’ordre alphabétique, nous allouons chaque unité à l’intervalle suivant:
Leave a Reply