slutningsstatistikk kan du trekke konklusjoner om bestander ved hjelp av små eksempler. Følgelig, slutningsstatistikk gi enorme fordeler fordi vanligvis kan du ikke måle en hel befolkning.
Imidlertid, for å få disse fordelene, må du forstå forholdet mellom bestander, undergrupper av befolkningen, befolkningen parametre, prøver, og prøver statistikk.
I dette blogg innlegget, jeg diskutere disse begrepene, og hvordan for å få representative prøver ved hjelp av random sampling.,
Relaterte innlegg: Forskjellen mellom Beskrivende og slutningsstatistikk
Bestander
Bestander kan omfatte personer, men andre eksempler er objekter, hendelser, bedrifter og så videre. I statistikken er det generelt to typer befolkningsgrupper.
Bestander kan være komplett sett av alle liknende elementer som finnes. For eksempel befolkningen i et land omfatter alle mennesker i dag i det aktuelle landet. Det er et begrenset, men potensielt stor liste over medlemmer.
Imidlertid en befolkning kan være en teoretisk konstruksjon som er potensielt uendelig i størrelse., For eksempel, kvalitetsforbedring analytikere ofte vurdere alle nåværende og fremtidige output fra et produksjons linje for å være en del av en befolkning.
Bestander dele et sett av attributter som du definerer. For eksempel, følgende bestander:
- Stjerner i melkeveien.
- Deler fra en produksjonslinje.
- Borgere av Usa.
Før du begynner på et studium, må du nøye definere populasjonen som du studerer. Disse bestandene kan være snevert definert til å møte behovene i din analyse., For eksempel, voksen svenske kvinner som ellers er frisk, men har osteoporose.
Undergrupper kan Forbedre Din Analyse
Undergrupper dele med flere attributter. For eksempel befolkningen i Usa inneholder undergrupper av menn og kvinner. Du kan også dele den på andre måter, for eksempel region, alder, sosioøkonomisk status, og så videre. Ulike studier som involverer den samme populasjonen kan dele det inn i ulike undergrupper, avhengig av hva som er fornuftig for data og analyser.,
Forstå undergrupper i studiet hjelper deg å ta tak i saken mer grundig. De kan også hjelpe deg med å produsere statistiske modeller som passer dataene bedre. Undergrupper er spesielt viktig når de har egenskaper som er systematisk annerledes enn den generelle befolkningen. Når du analysere dataene dine, må du være oppmerksom på disse dypere divisjoner. Faktisk, du kan behandle relevante undergrupper som ytterligere faktorer i senere analyser.,
For eksempel, hvis du er å analysere den gjennomsnittlige høyden av voksne i Usa, vil du forbedre dine resultater av blant mannlige og kvinnelige undergrupper fordi deres høyder er systematisk annerledes. Jeg vil dekke det eksempel i dybden senere i dette innlegget!
Befolkningen Parametere versus Eksempel Statistikk
En parameter er en verdi som beskriver en karakteristikk av en hel befolkning, slik som populasjonsgjennomsnittet. Fordi du kan nesten aldri måle en hel befolkning, du vanligvis ikke kjenner den virkelige verdien av en parameter., Faktisk, parameterverdiene er nesten alltid ukjennelige. Selv om vi ikke vet verdien, er det definitivt finnes.
For eksempel, den gjennomsnittlige høyden av voksne kvinner i Usa er en parameter som har en eksakt verdi—vi vet bare ikke hva det er!
populasjonsgjennomsnittet og standardavvik er to vanlige parametere. I statistikken, greske symboler vanligvis representere befolkningen parametere, slik som μ (mu) for det betyr og σ (sigma) for standardavvik.
En statistikk som er karakteristisk for et eksempel., Hvis du samler en prøve og beregne gjennomsnitt og standardavvik, dette er eksempel statistikk. Slutningsstatistikk tillate deg å bruke eksempel statistikk for å gjøre slutninger om en populasjon. Men å trekke gyldige konklusjoner, må du bruke spesielt sampling teknikker. Disse tiltakene bidrar til å sikre at prøvene produsere forventningsrette estimater. Partisk estimatene er systematisk for høye eller for lave. Du vil forventningsrette estimater fordi de er riktige i gjennomsnitt.
I slutningsstatistikk, vi bruker for eksempel statistikk for å beregne bestanden parametere., For eksempel, hvis vi samler inn et tilfeldig utvalg av voksne kvinner i Usa og måle høyder, kan vi beregne utvalgsgjennomsnittet, og bruke den som en objektiv beregning av befolkningen mener. Vi kan også utføre hypotesetesting på prøven estimat og skape tillit mellomrom for å konstruere et område som den faktiske befolkningen verdi trolig faller innenfor.,div id=»6aadacc401″>Mu (μ)
: Measures of Central Tendency and Measures of Variability
Representative Sampling and Simple Random Samples
In statistics, sampling refers to selecting a subset of a population., Etter tegning eksempel, du måle en eller flere egenskaper av alle elementer i utvalget, slik som høyde, inntekt, temperatur, meninger, osv. Hvis du ønsker å trekke konklusjoner om disse egenskapene i hele befolkningen, er det pålegger restriksjoner på hvordan du tar prøven. Hvis du bruker en feil metodikk, prøven kan ikke representere befolkningen, noe som kan føre til feilaktige konklusjoner.
Den mest kjente metoden for å få en upartisk, representativt utvalg er enkelt tilfeldig utvalg., Med denne metoden, er alle elementer i populasjonen har samme sannsynlighet for å bli valgt. Denne prosessen bidrar til å sikre at prøven omfatter hele spekteret av befolkningen. I tillegg, alle relevante undergrupper bør innlemmes i prøven og representert nøyaktig på gjennomsnittet. Enkelt tilfeldig utvalg reduserer fordommer og forenkler dataanalyse.
jeg vil diskutere prøvetaking metodikk i mer detalj i en fremtidig blogginnlegg, men det er flere viktige forbehold om enkelt tilfeldig utvalg., Mens denne tilnærmingen reduserer faren for bias, det betyr ikke at ditt eksempel statistikk nøyaktig lik befolkningen parametere. I stedet, estimater fra et spesifikt eksempel er sannsynlig å være litt for høye eller lave, men prosessen produserer nøyaktige anslag på gjennomsnittlig. Videre, det er mulig å få tak uvanlig prøver med random sampling—det er bare ikke det forventede resultat.
Relaterte innlegg: Eksempel Statistikk Er Alltid Galt (i Noen Grad)!
i Tillegg, random sampling kan høres litt tilfeldig og lett å gjøre—som begge er ikke sant., Enkelt tilfeldig utvalg antar at du systematisk sammenstille en komplett liste av alle personer eller gjenstander som finnes i befolkningen. Du kan deretter tilfeldig velger emner fra listen og ta dem med i utvalget. Det kan være en tungvint prosess.
La oss ta disse begrepene til livet!
Eksempel på en Populasjon med Viktige Undergrupper
la oss Anta at vi studerer høyden av Amerikanske borgere og la oss videre anta at vi ikke vet mye om emnet., Derfor samler vi inn et tilfeldig utvalg, måle høyden i cm, og beregne eksempel middelverdi og standardavvik. Her er CSV-data file: Høyder.
Vi får følgende resultater:
Fordi vi samlet et tilfeldig utvalg, kan vi anta at disse utvalget statistikk er forventningsrette estimater av befolkningen parametere.
Nå, la oss anta at vi lærer mer om studien, og inkluderer menn og kvinner som undergrupper. Vi får følgende resultater.,
legg Merke til hvor enkelt en bred distribusjon har blitt erstattet av to smalere distribusjoner? Fordelingen for hvert kjønn har et mindre standardavvik enn én distribusjon for alle voksne, som er konsistent med strammere spredt rundt det betyr for både menn og kvinner i grafen. Disse resultatene viser hvordan de mener gir mer presise anslag når vi vurdere høyder etter kjønn. Faktisk, gjennomsnittlig for hele befolkningen ikke er lik gjennomsnittet for enten subpopulasjon. Det er misvisende!,
i Løpet av denne prosessen lærer vi at kjønn er en avgjørende subpopulasjoner som er relatert til høyde og øker vår forståelse av saksforholdet. I fremtidige studier om høyde, kan vi inkludere kjønn som en prediktor variabel.
Dette eksemplet bruker et kategorisk grouping variable (Kjønn) og en kontinuerlig utfallet variabel (Høyder). Når du ønsker å sammenligne fordelingen av kontinuerlige verdier mellom grupper som dette eksemplet, kan du vurdere å bruke boxplots og individuelle verdi tomter. Disse plott bli mer nyttig som antall grupper øker.,
Dette eksemplet er med vilje lett å forstå, men tenk deg en studie om en mindre åpenbare motivet. Denne prosessen hjelper deg å få ny innsikt og gi bedre statistiske modeller.
ved Hjelp av din kunnskap om bestander, undergrupper, parametre, prøvetaking, og eksempel statistikk, kan du tegne verdifulle konklusjoner om store bestander ved hjelp av små eksempler. For mer informasjon om hvordan du kan teste hypoteser om bestander, les min Oversikt over hypotesetestene.
Leave a Reply