Johdettujen tilastojen avulla voit tehdä johtopäätöksiä väestön käyttämällä pieniä näytteitä. Näin ollen johdettu statistiikka antaa valtavasti hyötyä, koska tyypillisesti et voi mitata koko väestöstä.
Kuitenkin, saada nämä edut, sinun täytyy ymmärtää suhde väestön alaryhmien, väestön parametrit, näytteitä, ja näytteen tilastoja.
tässä blogikirjoituksessa käsittelen näitä käsitteitä ja sitä, miten saadaan edustavia näytteitä satunnaisotannalla.,
Related post: Ero Kuvailevan ja johdettu statistiikka
Väestön
Populaatiot voivat olla ihmisiä, mutta muita esimerkkejä ovat kohteet, tapahtumat, yritykset, ja niin edelleen. Tilastoissa populaatioita on kahta yleistä tyyppiä.
populaatiot voivat olla täydellinen joukko kaikkia samanlaisia kohteita, jotka ovat olemassa. Esimerkiksi jonkin maan väestöön kuuluvat kaikki maan nykyiset asukkaat. Se on rajallinen, mutta mahdollisesti suuri Jäsenlista.
populaatio voi kuitenkin olla teoreettinen konstruktio, joka on potentiaalisesti äärettömän kokoinen., Esimerkiksi laatuparannusanalyytikot pitävät usein kaikkea tuotantolinjan nykyistä ja tulevaa tuotantoa osana väestöä.
populaatioilla on joukko määritteitä, jotka määrittelet. Esimerkiksi seuraavat ovat populaatioita:
- tähtiä Linnunradan galaksissa.
- osia tuotantolinjasta.
- Yhdysvaltain kansalaiset.
ennen kuin aloitat tutkimuksen, sinun on määriteltävä huolellisesti tutkimasi populaatio. Nämä populaatiot voidaan määritellä suppeasti analyysisi tarpeisiin., Esimerkiksi aikuiset ruotsalaiset naiset, jotka ovat muuten terveitä mutta joilla on osteoporoosi.
Alaryhmiin voi Parantaa Analyysi
Alaryhmiin jakaa ylimääräisiä ominaisuuksia. Esimerkiksi Yhdysvaltain väestössä on miesten ja naisten alapopulaatioita. Voit myös jakaa sen muiden tavoin, kuten alue, ikä, sosioekonominen asema, ja niin edelleen. Eri tutkimukset, jotka koskevat samaa väestöä, voivat jakaa sen eri alaryhmiin sen mukaan, mikä on järkevää tietojen ja analyysien kannalta.,
tutkimuksesi alapopulaatioiden ymmärtäminen auttaa sinua ymmärtämään aihetta perusteellisemmin. Ne voivat myös auttaa sinua tuottamaan tilastollisia malleja, jotka sopivat paremmin tietoihin. Alapopulaatiot ovat erityisen tärkeitä silloin, kun niillä on systemaattisesti erilaisia ominaisuuksia kuin koko väestöllä. Kun analysoit tietojasi, sinun täytyy olla tietoinen näistä syvemmistä jakaumista. Itse asiassa, voit käsitellä asiaa alapopulaatioita lisätekijöinä myöhemmissä analyyseissä.,
esimerkiksi, jos olet analysoimalla keskimääräinen korkeus aikuista yhdysvalloissa, voit parantaa tuloksiasi sisällyttämällä miesten ja naisten alaryhmiin, koska niiden korkeudet ovat systemaattisesti erilaisia. Otan tämän esimerkin perusteellisesti myöhemmin tässä viestissä!
Väestö Parametrit vs. Näyte Tilastot
– parametri on arvo, joka kuvaa tyypillistä koko väestön, kuten populaation keskiarvo. Koska kokonaista väestöä ei voi juuri koskaan mitata, parametrin todellista arvoa ei yleensä tiedä., Itse asiassa parametriarvot ovat lähes aina tuntemattomia. Vaikka emme tiedä arvoa, se on ehdottomasti olemassa.
esimerkiksi, keskimääräinen korkeus aikuisista naisista yhdysvalloissa on parametri, joka on tarkka arvo—emme vain tiedä, mitä se on!
– populaation keskiarvo ja keskihajonta ovat kaksi yhteistä parametrit. Tilastoissa kreikkalaiset symbolit kuvaavat yleensä populaatioparametreja, kuten μ (mu) keskiarvoa ja σ (sigma) keskihajontaa.
tilasto on näytteen ominaisuus., Jos keräät näytteen ja lasket keskiarvon ja keskihajonnan, nämä ovat otostilastoja. Inferential statistics avulla voit käyttää otos tilastot tehdä johtopäätöksiä väestöstä. Pätevien johtopäätösten tekemiseksi sinun on kuitenkin käytettävä tiettyjä näytteenottotekniikoita. Nämä tekniikat auttavat varmistamaan, että näytteet tuottavat puolueettomia arvioita. Puolueelliset arviot ovat systemaattisesti liian korkeita tai liian alhaisia. Haluat puolueettomia arvioita, koska ne ovat keskimäärin oikeita.
johdettu statistiikka, me käyttää näytteen tilastoja arvioida väestön parametrit., Jos esimerkiksi keräämme satunnaisotoksen yhdysvaltalaisista aikuisista naisista ja mittaamme heidän korkeutensa, voimme laskea otoksen keskiarvon ja käyttää sitä puolueettomaan arvioon populaation keskiarvosta. Voimme myös suorittaa hypoteesin testaus näyte arvioida ja luoda luottamusta väliajoin rakentaa alue, että todellinen väestö-arvo todennäköisesti kuuluu.,div id=”6aadacc401″>Mu (μ)
: Measures of Central Tendency and Measures of Variability
Representative Sampling and Simple Random Samples
In statistics, sampling refers to selecting a subset of a population., Otoksen piirtämisen jälkeen mittaat yhden tai useamman ominaisuuden kaikista näytteessä olevista kohteista, kuten korkeudesta, tuloista, lämpötilasta, mielipiteestä jne. Jos haluat tehdä johtopäätöksiä näistä ominaisuuksista koko väestössä, se asettaa rajoituksia näytteen keräämiselle. Jos käytät väärää menetelmää, otos ei välttämättä edusta väestöä, mikä voi johtaa virheellisiin johtopäätöksiin.
tunnetuin menetelmä puolueettoman, edustavan näytteen saamiseksi on yksinkertainen satunnaisotanta., Tällä menetelmällä kaikilla populaation erillä on yhtä suuri todennäköisyys tulla valituksi. Tämä prosessi auttaa varmistamaan, että otos sisältää koko väestön. Lisäksi kaikki asiaankuuluvat alapopulaatiot olisi sisällytettävä näytteeseen ja esitettävä keskimäärin tarkasti. Yksinkertainen satunnaisotanta minimoi bias ja yksinkertaistaa tietojen analysointia.
käsittelen otantamenetelmää tarkemmin tulevassa blogikirjoituksessa, mutta yksinkertaisesta satunnaisotannasta on useita ratkaisevia varoituksia., Vaikka tämä lähestymistapa minimoi harhaa, se ei tarkoita, että näyte tilastot täsmälleen yhtä suuri väestö parametrit. Sen sijaan tietyn otoksen arviot ovat todennäköisesti hieman korkeita tai alhaisia, mutta prosessi tuottaa keskimäärin tarkkoja arvioita. Lisäksi on mahdollista saada epätavallisia näytteitä satunnaisotannalla—se ei vain ole odotettu tulos.
Related post: Otostilastot ovat aina vääriä (jossain määrin)!
lisäksi satunnaisotanta saattaa kuulostaa hieman sattumanvaraiselta ja helppo tehdä—molemmat eivät pidä paikkaansa., Yksinkertainen satunnaisotanta olettaa, että kokoat järjestelmällisesti täydellisen luettelon kaikista ihmisistä tai esineistä, jotka ovat olemassa väestössä. Sen jälkeen valitaan satunnaisesti koehenkilöt kyseiseltä listalta ja lisätään ne näytteeseen. Se voi olla hyvin raskas prosessi.
Let ’ s bring these concepts to life!
Esimerkki Väestön kanssa Tärkeää Alaryhmiin
Oletetaan, että tutkimme korkeus Amerikan kansalaisia ja mennään edelleen olettaa, että emme tiedä paljoakaan aiheesta., Näin ollen keräämme satunnaisnäytteen, mittaamme korkeudet senttimetreinä ja laskemme näytteen keskiarvon ja keskihajonnan. Tässä on CSV-tiedosto: Heights.
Saamme seuraavat tulokset:
Koska meidän on kerätty satunnaisotannalla, voimme olettaa, että nämä näyte tilastot ovat puolueettomia arvioita väestön parametrit.
nyt, oletetaan, että saamme lisätietoa tutkimusalueesta ja että alaryhminä ovat mies ja nainen. Saamme seuraavat tulokset.,
Huomaa, miten yksittäinen laaja jakelu on korvattu kaksi kapeampi jakaumat? Jakelu kunkin sukupuoli on pienempi keskihajonta kuin yhden jakelun kaikkien aikuisten, joka on sopusoinnussa tiukempi levinnyt ympäri tarkoittaa sekä miesten ja naisten kuvaaja. Tulokset osoittavat, miten keskiarvo antaa tarkemmat arviot, kun arvioimme korkeuksia sukupuolen mukaan. Itse asiassa koko väestön keskiarvo ei vastaa kummankaan alaväestön keskiarvoa. Se on harhaanjohtavaa!,
tämän prosessin Aikana, me opimme, että sukupuoli on keskeinen tekemät, joka liittyy korkeus ja lisää ymmärrystä aiheesta. Tulevissa pituustutkimuksissa voimme sisällyttää sukupuolen ennustinmuuttujaksi.
tässä esimerkissä käytetään kategorista ryhmämuuttujaa (sukupuolta) ja jatkuvaa tulosmuuttujaa (korkeuksia). Kun haluat vertailla jakaumat jatkuva-arvot ryhmien välillä kuten tässä esimerkissä, harkitse boxplots ja yksittäisten tonttien arvo. Näistä tonteista tulee hyödyllisempiä, kun ryhmien määrä kasvaa.,
Tämä esimerkki on tarkoituksellisesti helppo ymmärtää, mutta kuvitelkaa tutkimus vähemmän ilmeisestä aiheesta. Tämä prosessi auttaa sinua saamaan uusia oivalluksia ja tuottamaan parempia tilastollisia malleja.
Käyttämällä tietoa väestön alaryhmien, parametrit, näytteenotto ja näytteen tilastoja, voit tehdä arvokkaita päätelmiä suuret populaatiot käyttämällä pieniä näytteitä. Lisätietoja siitä, miten voit testata hypoteeseja populaatioista, Lue yleiskatsaus Hypoteesitesteistä.
Leave a Reply