Hypoteesin testaus on tärkeä prosessi johdettu statistiikka, jossa tavoitteena on käyttää otoksen tietoja tehdä päätelmiä koko väestöstä. Testauksessa käytetään merkitsevyystasoja ja p-arvoja sen määrittämiseksi, ovatko testitulokset tilastollisesti merkitseviä.
kuulet, että tulokset ovat koko ajan tilastollisesti merkitseviä. Mutta mitä merkityksellisyystasot, p-arvot ja tilastollinen merkitys todellisuudessa edustavat? Miksi tilastoissa pitää edes käyttää hypoteesitestejä?,
tässä viestissä vastaan kaikkiin näihin kysymyksiin. Käytän kuvaajia ja käsitteitä selittääkseni, miten hypoteesitestit toimivat, jotta voin antaa intuitiivisemman selityksen. Tämä auttaa sinua ymmärtämään tilastollisia tuloksia.
Hypoteesi Testata Esimerkiksi Skenaario
aloittaa, näytän miksi meidän täytyy käyttää hypoteesi testit käyttäen esimerkkinä.
tutkija tutkii polttoaineen menot perheille ja haluaa määrittää, jos kuukausittaiset kustannukset on muuttunut viime vuodesta, kun keskiarvo oli $260 kuukaudessa., Tutkija piirtää satunnaisotoksen 25 perheestä ja syöttää tämän vuoden kuukausittaiset kustannuksensa tilastoohjelmistoihin. Voit ladata CSV-tiedoston: FuelsCosts. Alla on tämän vuoden kuvaava tilasto.
Me rakentaa tämän esimerkiksi vastata tutkimuskysymykseen ja näyttää, miten hypoteesi testit toimivat.
Kuvailevia Tilastoja ei Yksin Vastata Kysymykseen,
tutkija on kerätty satunnaisotos ja totesi, että tänä vuonna on otoksen keskiarvo (330.6) on suurempi kuin viime vuoden keskiarvo (260). Miksi tehdä hypoteesikoe ollenkaan?, Voimme nähdä, että tämän vuoden keskiarvo on korkeampi $70! Eikö se ole erilaista?
Valitettavasti tilanne ei ole niin selkeä kuin luulisi, koska analysoimme otoksen sijaan koko väestöstä. Näytteiden kanssa työskentelemisestä on valtavasti hyötyä, koska dataa on yleensä mahdotonta kerätä koko väestöltä. Kuitenkin kompromissi kanssa hallittavissa otos on, että meidän tilille sample virhe.
näytteenottovirhe on otostilaston ja populaatioparametrin välinen ero., Esimerkiksi otostilasto on otoksen keskiarvo, joka on 330,6. Populaatioparametri on μ eli mu, joka on koko populaation keskiarvo. Valitettavasti populaatioparametrin arvo ei ole vain tuntematon vaan yleensä tuntematon.
saimme näytteen keskiarvo 330.6. On kuitenkin mahdollista, että näytteenottovirheen vuoksi populaation keskiarvo voisi olla vain 260. Jos tutkija vetäisi toisen satunnaisotoksen, seuraavan näytteen keskiarvo voisi olla lähempänä 260: tä. Tätä mahdollisuutta on mahdotonta arvioida katsomalla vain näytteen keskiarvoa., Hypoteesin testaus on eräänlaista johdettu statistiikka, jonka avulla voimme tehdä johtopäätöksiä koko väestöä edustavasta otoksesta. Meidän täytyy käyttää hypoteesi testi määrittää todennäköisyys saada näyte keskiarvo, jos populaation keskiarvo on 260.,
Taustatiedot: Ero Kuvailevan ja johdettu statistiikka ja Populaatioiden, Parametrit, ja Näytteet johdettu statistiikka.
Näytteenotto Jakelu Määrittää, Onko Meidän Näyte Tarkoittaa, on Epätodennäköistä,
Se on hyvin epätodennäköistä, että kaikki näyte tarkoittaa yhtä populaation keskiarvo, koska sample virhe. Meidän tapauksessa näytteen keskiarvo 330.6 on lähes varmasti ole sama kuin populaation keskiarvo polttoaineen menot.,
Jos voisimme saada huomattava määrä satunnaisia näytteitä ja laskea näytteen keskiarvo jokaiselle näytteelle, meidän pitäisi tarkkailla laaja otos tarkoittaa. Pystyisimme jopa kuvaamaan näytteiden jakautumisen tästä prosessista.
tällaista jakautumista kutsutaan näytteenottojakaumaksi. Näytteenottojakauman saa piirtämällä samasta populaatiosta useita samankokoisia satunnaisnäytteitä. Miksi ihmeessä tekisimme näin?,
Koska näytteenotto jakaumat avulla voit määrittää todennäköisyys saada näyte tilastotieto ja ne ovat ratkaisevan tärkeä suorittaa hypoteesi testit.
onneksi ei tarvitse vaivautua keräämään lukuisia satunnaisnäytteitä! Voimme arvioida näytteenottojakauman käyttämällä T-jakaumaa, näytteen kokoa ja näytteen vaihtelua.
haluamme selvittää, poikkeavatko tämän vuoden keskimääräiset polttoainemenot (330,6) viime vuodesta (260)., Voit vastata tähän kysymykseen, meidän täytyy kuvaaja näytteenotto-jakelu, joka perustuu olettamukseen, että keskimääräinen polttoaineen kustannukset koko väestöstä ei ole muuttunut ja on edelleen 260. Tilastoissa kutsumme tätä vaikutuksen puutetta, tai ei muutosta, nollahypoteesi. Käytämme nollahypoteesi arvon perusteella verrattuna meidän havaittu näytteen arvo.
Näytteenotto jakaumat ja t-jakaumat ovat erilaisia todennäköisyysjakaumia. Lue lisää todennäköisyysjakaumista!,
Piirtäminen meidän Näyte Tarkoita Yhteydessä Näytteenotto Jakelu
alla Oleva kaavio osoittaa, mitkä keinot ovat todennäköisesti enemmän ja vähemmän todennäköistä, jos populaation keskiarvo on 260. Voimme sijoittaa näytteen keskiarvon tähän jakaumaan. Tämä suurempi konteksti auttaa meitä näkemään, kuinka epätodennäköistä otoksen keskiarvo on, jos nollahypoteesi on totta (μ = 260).
kuvaaja näyttää arvioitu jakautuminen näyte tarkoittaa. Todennäköisimmät arvot ovat lähellä 260: tä, koska juoni olettaa, että kyseessä on todellinen väestökeskiarvo., Satunnaisotantavirheen vuoksi ei kuitenkaan olisi yllättävää havaita 167-352 näytteenottovälineitä. Jos populaation keskiarvo on edelleen 260, meidän havaittu otoksen keskiarvo (330.6) ei ole todennäköisin arvo, mutta se ei ole täysin epäuskottavaa, joko.
Rooli Hypoteesi Testit
näytteenotto jakelu osoittaa meille, että olemme suhteellisen epätodennäköistä saada näyte 330.6 jos populaation keskiarvo on 260. Merkitseekö otoksemme niin epätodennäköistä, että voimme hylätä ajatuksen siitä, että populaation keskiarvo olisi 260?
tilastoissa tätä kutsutaan nollahypoteesin hylkäämiseksi., Jos hylkäämme null, esimerkiksi, ero näytteen keskiarvon (330.6) ja 260 on tilastollisesti merkitsevä. Toisin sanoen otostiedot suosivat hypoteesia, jonka mukaan väestökeskiarvo ei vastaa 260: tä.
kuitenkin, katso näytteenoton jakelukaavio uudelleen. Huomaa, että ei ole erityistä sijaintia käyrä, jossa voit lopullisesti tehdä tämän päätelmän. On vain johdonmukainen lasku todennäköisyys tarkkailemalla näyte tarkoittaa, että ovat kauempana nollahypoteesin arvo. Mistä päätämme, että näytteen keskiarvo on tarpeeksi kaukana?,
tähän kysymykseen vastataksemme tarvitsemme lisää työkaluja-hypoteesitestejä! Hypoteesin testausmenettely kvantifioi näytteemme epätavanomaisuuden todennäköisyydellä ja vertaa sitä sitten todistusvaatimukseen. Tämän prosessin avulla voit tehdä objektiivisen päätöksen todisteiden vahvuudesta.
aiomme lisätä työkalut Meidän täytyy tehdä tämän päätöksen graafi-merkitys tasot ja p-arvot!
Näiden työkalujen avulla voimme testata näitä kahta hypoteesit:
- nollahypoteesi: perusjoukon keskiarvo on yhtä suuri kuin nollahypoteesi tarkoittaa (260).,
- Vaihtoehtohypoteesi: populaation keskiarvo ei vastaa nollahypoteesin keskiarvoa (260).
Related post: Hypoteesin Testaus Yhteenveto
Mitä Merkitystä Tasolla (Alfa)?
merkitsevyystaso, joka tunnetaan myös nimillä alfa tai α, on todistusvoimainen standardi, jonka tutkija asettaa ennen tutkimusta. Siinä määritellään, kuinka vahvasti otoksen todistusaineiston on oltava ristiriidassa nollahypoteesin kanssa, ennen kuin voit hylätä nollahypoteesin koko väestölle. Todistusaineiston vahvuus määritellään todennäköisyydellä hylätä nollahypoteesi, joka on totta., Toisin sanoen, se on todennäköisyys, että sanot on vaikutusta, kun ei ole vaikutusta.
esimerkiksi, merkitsevyystaso 0,05 merkitsee 5%: n riskiä päättää, että vaikutus on olemassa, kun sitä ei ole olemassa.
pienempi merkitsevyystaso edellyttää vahvempaa otosnäyttöä, jotta nollahypoteesi voidaan hylätä. Esimerkiksi, on tilastollisesti merkitsevä 0.01 merkitsevyystasolla edellyttää vankempaa näyttöä kuin 0.05 merkitsevyyden tason. Hypoteesitesteissä on kuitenkin tradeoff., Pienemmät merkitsevyystasot vähentävät myös hypoteesitestin tehoa, jotta voidaan havaita olemassa oleva ero.
näiden kysymysten tekninen luonne voi saada pään pyörimään. Kuva voi herättää nämä ajatukset eloon!
oppiaksesi käsitteellisemmän lähestymistavan merkityksellisyystasoihin, katso postaukseni Merkityksellisyystasojen ymmärtämisestä.
Kuvaajien Merkitys Tasoa kuin Kriittinen Alueet
todennäköisyys jakelu juoni, merkitsevyystaso määrittää, kuinka paljon näytteen arvo on null-arvo, ennen kuin voimme hylätä null., Prosenttiosuus alle jäävä pinta-ala, joka on tummennetut sama kuin todennäköisyys, että näytteen arvo laskee näillä alueilla, jos nollahypoteesi on oikea.
edustaa merkitsevyystaso 0,05, minä sävy 5% jakelu kauimpana null-arvon.
kaksi tummennetut alueet kaaviossa ovat yhtä kaukana keski-arvo sekä nollahypoteesi. Kunkin alueen todennäköisyys on 0,025, mikä summaa tavoiteltuun 0,05: een. Näitä varjostettuja alueita kutsutaan kaksipyrstöisen hypoteesitestin kriittiseksi alueeksi.,
kriittinen alue määrittelee otosarvot, jotka ovat niin epätodennäköisiä, että nollahypoteesi hylätään. Jos nollahypoteesi on oikea ja populaation keskiarvo on 260, satunnaisotos (n=25) tästä väestöstä on tarkoittaa, että lasku kriittinen alue 5% ajasta.
näytteen keskiarvomme on tilastollisesti merkitsevä 0, 05-tasolla, koska se kuuluu kriittiselle alueelle.
Related post: yksisuuntainen ja kaksisuuntainen Testit Selitti
Vertaamalla Merkitys Tasoilla
tee uudelleen tämän hypoteesin testaus käyttäen muita yleisiä merkitys taso 0.,01 nähdä, miten se vertaa.
Tällä kertaa summa kahden tummennetut alueet on yhtä kuin uusi merkitsevyystasolla 0,01. Otoksemme keskiarvo ei kuulu kriittiseen alueeseen. Näin ollen emme hylkää nollahypoteesia. Meillä on saman näytteen tiedot, sama ero näytteen keskiarvon ja nollahypoteesin arvo, mutta eri testin tulos.
mitä tapahtui? Määrittelemällä pienemmän merkitsevyystason asetimme suuremman riman näytteelle., Kuten kuvaaja osoittaa, pienemmät merkityksellisyystasot vievät kriittiset alueet kauemmas nollan arvosta. Näin ollen alhaisemmat merkitsevyystasot edellyttävät, että äärimmäiset otantamenetelmät ovat tilastollisesti merkitseviä.
sinun on asetettava merkitsevyystaso ennen tutkimuksen tekemistä. Et halua kiusausta valita tutkimuksen jälkeen taso, joka tuottaa merkittäviä tuloksia. Ainoa syy, miksi vertasin kaksi merkityksen tasoa oli havainnollistaa vaikutuksia ja selittää erilaiset tulokset.,
luomamme 1-näytteen t-testin graafinen versio mahdollistaa tilastollisen merkitsevyyden määrittämisen ilman P-arvoa. Tyypillisesti sinun täytyy verrata P-arvoa merkitsevyystasoon, jotta tämä määritys voidaan tehdä.
Related post: Step-by-Step Ohjeet siitä, Miten Tehdä t-Testit Excel
Mitä Ovat P-arvot?
P-arvo on todennäköisyys, että näyte on vaikutusta vähintään yhtä äärimmäinen kuin vaikutus havaittiin näytteen, jos nollahypoteesi on oikea.
tämä piinaava, tekninen määritelmä P-arvoille voi saada pään pyörimään., Kuvitetaan se!
ensin on laskettava näytteessämme oleva vaikutus. Vaikutus on etäisyys näytteen arvon ja null-arvo: 330.6 – 260 = 70.6. Seuraava, minä sävy alueet molemmin puolin jakelu, jotka ovat vähintään yhtä kaukana kuin 70.6 null (260 +/- 70.6). Tämä prosessi kuvaaja todennäköisyys havainnoida näyte tarkoittaa vähintään yhtä äärimmäinen kuin meidän näyte keskiarvo.
yhteensä todennäköisyydellä kaksi tummennetut alueet on 0.03112., Jos nollahypoteesin arvo (260) on totta ja piirsit monia satunnaisnäytteitä, otoksen odotetaan laskevan varjoisilla alueilla noin 3,1 prosenttia ajasta. Toisin sanoen, voit tarkkailla näyte vaikutuksia vähintään 70,6 noin 3,1% ajasta, jos nolla on totta. Se on p-arvo!
Käyttämällä P-arvot ja Merkitys Tasot Yhdessä
Jos P-arvo on pienempi tai yhtä suuri kuin alpha-tasolla, hylätä nollahypoteesi.
P-arvotulokset vastaavat graafista esitystämme. P-arvo 0,03112 on merkittävä alfatasolla 0,05, mutta ei 0.,01. Taas käytännössä valitaan yksi merkityksellisyystaso ennen kokeilua ja pidetään siitä kiinni!
Käyttämällä merkitsevyystaso 0,05, näytteen vaikutus on tilastollisesti merkitsevä. Aineistomme tukee vaihtoehtoista hypoteesia, jonka mukaan väestön keskiarvo ei vastaa 260: tä. Voimme päätellä, että keskimääräiset polttoainemenot ovat kasvaneet viime vuodesta.
p arvot tulkitaan hyvin usein väärin todennäköisyydeksi hylätä nollahypoteesi, joka on todellisuudessa totta. Tämä tulkinta on väärä! Ymmärtää miksi, Lue postaukseni: miten tulkita P-arvot oikein.,
Keskustelua Tilastollisesti Merkittäviä Tuloksia
Hypoteesi testit selvittää, onko näyte tietoja esitetä riittävästi näyttöä, joka hylkää nollahypoteesin koko väestöstä. Tämän testin suorittamiseksi menettely vertaa näytteen tilastoa nollaan arvoon ja määrittää, onko se riittävän harvinainen. ”Riittävän harvinainen” on määritelty hypoteesi testi:
- Olettaen, että nollahypoteesi on totta—kuvaajat center null-arvo.
- merkitys (alfa) taso—kuinka kaukana nollan arvosta on kriittinen alue?,
- otostilasto – onko se kriittisellä alueella?
ei ole erityistä merkitsevyystasoa, joka määrittää oikein, mitkä tutkimukset ovat todellisia väestövaikutuksia 100% ajasta. Perinteinen merkitsevyys tasolla 0,05 ja 0,01 ovat yrityksiä hallita kompromissi välillä, joilla on alhainen todennäköisyys hylätä tosi nollahypoteesi ja joilla on riittävä teho havaita vaikutusta, jos yksi todella on olemassa.
merkitsevyystaso on nopeus, jolla voit virheellisesti hylkää null hypoteeseja, jotka ovat todella totta (tyypin I virhe)., Esimerkiksi kaikki tutkimukset, jotka käyttävät merkitsevyystaso 0,05 ja nollahypoteesi on oikea, voit odottaa 5% heistä on näytteen tilastoja, jotka kuuluvat kriittisen alueen. Kun tämä virhe ilmenee, et ole tietoinen siitä, että nollahypoteesi on oikea, mutta voit hylätä sen, koska p-arvo on alle 0,05.
tämä virhe ei viittaa siihen, että tutkija olisi tehnyt virheen. Kuten kuvaajat osoittavat, voit tarkkailla extreme otos tilastoja, koska näyte virhe yksin. Se on arvonnan onni!,
Related post: Tyypit Virheitä Hypoteesin Testaus
Hypoteesi testit ovat tärkeitä, kun haluat käyttää otoksen tietoja tehdä johtopäätöksiä siitä väestöstä, koska nämä testit osuus sample virhe. Merkitsevyystasojen ja p-arvojen käyttäminen sen määrittämiseksi, milloin nollahypoteesi hylätään, parantaa todennäköisyyttä, että teet oikean johtopäätöksen.
Pitää mielessä, että tilastollinen merkitsevyys ei välttämättä tarkoita, että vaikutus on tärkeä käytännön, reaalimaailman mielessä. Lisätietoja, lue postaukseni käytännön vs. tilastollinen merkitys.,
Jos pidät tästä viestistä, Lue seurapostaus: miten Hypoteesitestit toimivat: luottamusvälit ja luottamustasot.
Voit myös lukea muiden viestit, jotka kuvaavat, miten muut testit toimivat:
- Miten t-Testit Toimivat
- Miten F-testi toimii ANOVA
- Miten Chi-Neliö Testejä Itsenäisyyden Työtä
nähdä vaihtoehtoinen lähestymistapa perinteisen hypoteesin testaus, joka ei käytä todennäköisyys jakaumat ja testi tilastoja, oppia bootstrapping tilastoissa!
Leave a Reply