Hipotézis tesztelése létfontosságú folyamat matematikai statisztika, ahol a cél az, hogy használja a minta adatok következtetéseket levonni arról, hogy az egész népességet. A tesztelési folyamat során a szignifikanciaszinteket és a p-értékeket használjuk annak meghatározására, hogy a teszteredmények statisztikailag szignifikánsak-e.
azt hallja, hogy az eredmények egész idő alatt statisztikailag szignifikánsak. De mit jelentenek valójában a szignifikanciaszintek, a p értékek és a statisztikai szignifikancia? Miért kell egyáltalán hipotézis teszteket használni a statisztikákban?,
ebben a bejegyzésben válaszolok ezekre a kérdésekre. Gráfokat és fogalmakat használok, hogy elmagyarázzam, hogyan működnek a hipotézistesztek annak érdekében, hogy intuitívabb magyarázatot adjak. Ez segít továbblépni a statisztikai eredmények megértésében.
hipotézis teszt példa forgatókönyv
a kezdéshez megmutatom, miért kell hipotézis teszteket használni egy példa segítségével.
a kutató a családok üzemanyagköltségeit vizsgálja, és azt akarja meghatározni, hogy a havi költség megváltozott-e tavaly óta, amikor az átlag havonta 260 dollár volt., A kutató 25 család véletlenszerű mintáját rajzolja ki, és az idei havi költségeiket statisztikai szoftverbe foglalja. Letöltheti a CSV adatfájlt: FuelsCosts. Az alábbiakban ismertetjük az idei évre vonatkozó leíró statisztikákat.
erre a példára építünk, hogy megválaszoljuk a kutatási kérdést, és megmutassuk, hogyan működnek a hipotézis tesztek.
A leíró statisztikák önmagukban nem válaszolnak arra a kérdésre, hogy
a kutató véletlenszerű mintát gyűjtött össze, és megállapította, hogy az idei minta átlaga (330,6) nagyobb, mint a tavalyi átlag (260). Miért végezzen egyáltalán hipotézis tesztet?, Láthatjuk, hogy az idei átlag 70 dollárral magasabb! Hát nem más?
Sajnálatos módon a helyzet nem olyan egyértelmű, mint gondolnád, mert a teljes népesség helyett egy mintát elemezünk. A mintákkal való munka során hatalmas előnyök vannak, mivel általában lehetetlen adatokat gyűjteni egy egész populációból. A kezelhető mintával való munka kompromisszuma azonban az, hogy figyelembe kell vennünk a minta hibáját.
a mintavételi hiba a mintavételi statisztika és a populációs paraméter közötti különbség., Példánkban a minta statisztika a minta átlaga, ami 330.6. A populációs paraméter μ vagy mu, ami a teljes népesség átlaga. Sajnos a populációs paraméter értéke nem csak ismeretlen, hanem általában ismeretlen.
a minta átlaga 330,6 volt. Elképzelhető azonban, hogy mintavételi hiba miatt a lakosság átlaga csak 260 lehet. Ha a kutató újabb véletlenszerű mintát vett, a következő minta átlaga közelebb lehet a 260-hoz. Lehetetlen felmérni ezt a lehetőséget, ha csak a minta átlagát nézzük., A hipotézisvizsgálat a következtetési statisztikák egyik formája, amely lehetővé teszi számunkra, hogy reprezentatív minta alapján következtetéseket vonjunk le egy teljes populációról. Hipotézis tesztet kell használnunk annak meghatározására, hogy mekkora a valószínűsége annak, hogy a minta átlaga 260.,
Háttér-információ: A Különbség a között, hogy a Leíró, valamint Matematikai Statisztika, illetve Populációk, Paramétereket, majd a Mintákat a Matematikai Statisztika
A Mintavételi Engedély Határozza meg, Hogy A Minta, Vagyis nem Valószínű,
Ez nagyon valószínűtlen, hogy bármilyen minta azt jelenti, hogy egyenlő a lakosság, mert a minta hiba. Esetünkben a 330,6-os minta átlaga szinte biztosan nem egyenlő az üzemanyagköltségek lakossági átlagával.,
ha jelentős számú véletlenszerű mintát tudnánk beszerezni és kiszámítanánk a minta átlagát minden egyes minta esetében, a minta eszközeinek széles spektrumát figyelnénk meg. Még a mintaeszközök eloszlását is képesek lennénk ábrázolni ebből a folyamatból.
Az ilyen típusú eloszlást mintavételi eloszlásnak nevezik. Mintavételi eloszlást kap azáltal, hogy sok azonos méretű véletlenszerű mintát rajzol ugyanabból a populációból. Mi a fenéért tennénk ezt?,
mivel a mintavételi eloszlások lehetővé teszik a mintavételi statisztika megszerzésének valószínűségét, és döntő fontosságúak a hipotézisvizsgálatok elvégzéséhez.
szerencsére nem kell számos véletlenszerű minta összegyűjtésével foglalkoznunk! A mintavételi eloszlást a t-eloszlás, a minta mérete, valamint a minta változékonysága alapján becsülhetjük meg.
azt szeretnénk megtudni, hogy az átlagos üzemanyagköltségek ebben az évben (330, 6) eltérnek-e a tavalyi évtől (260)., A kérdés megválaszolásához a mintavételi eloszlást azon a feltételezésen alapul, hogy a teljes lakosság átlagos üzemanyagköltsége nem változott, még mindig 260. A statisztikákban ezt a hatáshiányt vagy változást nem nevezzük null hipotézisnek. A null hipotézis értékét használjuk a megfigyelt mintaérték összehasonlításának alapjaként.
A mintavételi eloszlások és a T-eloszlások a valószínűségi eloszlások típusai. Tudjon meg többet a valószínűségi eloszlásokról!,
A mintavételi Eloszlás összefüggésében a minta átlagának grafikonja
az alábbi grafikon azt mutatja, hogy mely minta eszközök valószínűbbek és kevésbé valószínűek, ha a populációs átlag 260. Ebben az elosztásban elhelyezhetjük a mintaértékünket. Ez a nagyobb kontextus segít abban, hogy lássuk, mennyire valószínűtlen a mintánk, ha a null hipotézis igaz (μ = 260).
a grafikon a minta becsült eloszlását mutatja. A legvalószínűbb értékek közel 260, mert a cselekmény feltételezi,hogy ez a valódi népesség., A véletlenszerű mintavételi hiba miatt azonban nem lenne meglepő a 167-352 közötti mintavételi eszközök megfigyelése. Ha a népesség átlaga még mindig 260, akkor a megfigyelt mintaértékünk (330,6) nem a legvalószínűbb érték, de ez sem teljesen valószínűtlen.
A Hipotézisvizsgálatok szerepe
a mintavételi Eloszlás azt mutatja, hogy viszonylag valószínűtlen, hogy 330, 6-os mintát kapunk, ha a populáció átlaga 260. A mintánk olyan valószínűtlen, hogy elutasíthatjuk azt a gondolatot, hogy a népesség átlaga 260?
a statisztikákban ezt a null hipotézis elutasításának nevezzük., Ha például elutasítjuk a nullát, akkor a minta átlaga (330,6) és a 260 közötti különbség statisztikailag szignifikáns. Más szavakkal, a mintaadatok előnyben részesítik azt a hipotézist, hogy a népesség átlaga nem egyenlő 260-mal.
azonban nézd meg újra a mintavételi elosztási táblázatot. Vegye figyelembe, hogy a görbén nincs külön hely, ahol véglegesen levonhatja ezt a következtetést. A minta megfigyelésének valószínűsége csak következetesen csökken, ami távolabb van a null hipotézis értékétől. Hol döntjük el, hogy a minta átlaga elég messze van?,
a kérdés megválaszolásához több eszközre lesz szükségünk-hipotézis tesztekre! A hipotézisvizsgálati eljárás számszerűsíti a minta szokatlanságát valószínűséggel, majd összehasonlítja egy bizonyító standarddal. Ez a folyamat lehetővé teszi, hogy objektív döntést hozzon a bizonyítékok erejéről.
hozzá fogjuk adni az ehhez szükséges eszközöket a gráf-szignifikancia szintekhez és P-értékekhez!
Ezek az eszközök lehetővé teszik számunkra, hogy teszteljük ezt a két hipotézist:
- Null hipotézis: a populáció átlaga megegyezik a null hipotézis átlagával (260).,
- alternatív hipotézis: a populációs átlag nem egyenlő a null hipotézis átlagával (260).
kapcsolódó hozzászólás: hipotézis tesztelési áttekintés
mik azok a szignifikancia szintek (Alfa)?
a szignifikancia szint, más néven alfa vagy α, bizonyító szabvány, amelyet a kutató a vizsgálat előtt állít be. Meghatározza, hogy a minta bizonyítékainak mennyire kell ellentmondaniuk A null hipotézisnek, mielőtt elutasítanák A null hipotézist az egész lakosság számára. A bizonyítékok erősségét az igaz nullhipotézis elutasításának valószínűsége határozza meg., Más szóval, annak a valószínűsége, hogy azt mondod, hogy van hatás, ha nincs hatás.
például egy 0,05-ös szignifikancia szint 5% – os kockázatot jelent annak eldöntésére, hogy létezik-e hatás, ha nem létezik.
Az alacsonyabb szignifikanciaszintek erősebb minta-bizonyítékot igényelnek ahhoz, hogy elutasítsák a null hipotézist. Például ahhoz, hogy statisztikailag szignifikáns legyen az 0.01 szignifikancia szintjén, jelentősebb bizonyítékokra van szükség, mint a 0.05 szignifikancia szint. Van azonban egy kompromisszum a hipotézis tesztekben., Az alacsonyabb szignifikanciaszintek szintén csökkentik a hipotézis teszt erejét a létező különbség kimutatására.
az ilyen típusú kérdések technikai jellege megfordíthatja a fejét. Egy kép életre keltheti ezeket az ötleteket!
a jelentési szintek fogalmi megközelítésének megismeréséhez olvassa el a jelentési szintek megértéséről szóló hozzászólásomat.
A szignifikancia szintek kritikus régióként történő ábrázolása
a valószínűségi eloszlási telken a szignifikancia szint meghatározza, hogy a mintaértéknek milyen messze kell lennie a null értéktől, mielőtt elutasíthatjuk a null értéket., Az árnyékolt görbe alatti terület százalékos aránya megegyezik azzal a valószínűséggel, hogy a minta értéke azokban a régiókban csökken, ha a null hipotézis helyes.
a 0,05-ös szignifikancia szint megjelenítéséhez A null értéktől legtávolabbi Eloszlás 5% – át árnyékolom.
a grafikon két árnyékolt régiója egyenlő távolságra van a null hipotézis központi értékétől. Minden régiónak 0,025 valószínűsége van, ami a kívánt 0,05-ös összeget foglalja össze. Ezeket az árnyékolt területeket a Kétfarkú hipotézis teszt kritikus régiójának nevezik.,
a kritikus régió olyan mintaértékeket határoz meg, amelyek elég valószínűtlenek ahhoz, hogy indokolják a null hipotézis elutasítását. Ha a nullhipotézis helyes, és a populáció átlaga 260, akkor ebből a populációból származó véletlenszerű minták (n=25) azt jelentik, hogy az idő 5% – ában csökken a kritikus régióban.
minta átlagunk statisztikailag szignifikáns a 0, 05 szinten, mert a kritikus régióban esik.
kapcsolódó bejegyzés: Egyfarkú és Kétfarkú tesztek magyarázata
szignifikancia szintek összehasonlítása
ismételjük meg ezt a hipotézistesztet a 0 másik közös szignifikanciaszinttel.,01 hogy hogyan összehasonlítja.
ezúttal a két árnyékolt régió összege megegyezik a 0, 01 új szignifikanciaszintünkkel. A minta átlaga nem tartozik a kritikus régióba. Következésképpen nem utasítjuk el a null hipotézist. Ugyanazokkal a pontos mintaadatokkal rendelkezünk, ugyanaz a különbség a minta átlaga és a null hipotézis értéke között, de más a vizsgálati eredmény.
mi történt? Az alacsonyabb szignifikanciaszint megadásával magasabb sávot állítunk be a minta bizonyítékaihoz., Ahogy a grafikon mutatja, az alacsonyabb szignifikanciaszintek a kritikus régiókat távolabb helyezik a null értéktől. Következésképpen az alacsonyabb szignifikanciaszintek statisztikailag szignifikánsnak kell lenniük a szélsőséges mintaeszközöknek.
a vizsgálat elvégzése előtt be kell állítania a szignifikancia szintet. Nem akarja, hogy a vizsgálat után olyan szintet válasszon, amely jelentős eredményeket hoz. Az egyetlen ok, amiért összehasonlítottam a két szignifikanciaszintet, az volt, hogy bemutassam a hatásokat, és elmagyarázzam a különböző eredményeket.,
az általunk létrehozott 1-minta T-teszt grafikus verziója lehetővé teszi a statisztikai szignifikancia meghatározását a P érték értékelése nélkül. Általában össze kell hasonlítania a P értéket a szignifikancia szinttel, hogy ezt a meghatározást elvégezze.
kapcsolódó bejegyzés: lépésről lépésre, hogyan kell csinálni T-tesztek Excel
mik P értékek?
a p értékek annak a valószínűsége, hogy egy minta hatása legalább olyan szélsőséges, mint a mintában megfigyelt hatás, ha a null hipotézis helyes.
Ez a kanyargós, technikai meghatározás A P értékekre a fejét forgathatja., Mutassuk meg!
először ki kell számítanunk a mintánkban jelen lévő hatást. A hatás a mintaérték és a null érték közötti távolság: 330,6-260 = 70,6. Ezután árnyékolom az eloszlás mindkét oldalán lévő régiókat, amelyek legalább olyan messze vannak, mint az 70.6 A null-tól (260 +/- 70.6). Ez a folyamat grafikonok a minta megfigyelésének valószínűsége legalább olyan extrém, mint a mintánk.
a két árnyékolt régió teljes valószínűsége 0,03112., Ha a null hipotézis értéke (260) igaz, és sok véletlenszerű mintát rajzoltál, akkor azt várnád, hogy a minta az árnyékolt régiókban az idő körülbelül 3,1% – át esik. Más szóval, megfigyelheti a mintahatásokat legalább olyan nagy, mint az 70.6 az idő körülbelül 3.1% – A, ha a null igaz. Ez a P érték!
p értékek és szignifikancia szintek együttes használata
Ha a P értéke kisebb vagy egyenlő az alfa szinttel, utasítsa el a null hipotézist.
A P érték eredményei összhangban vannak a grafikus ábrázolással. A 0,03112 p értéke 0,05 alfa szinten jelentős, de nem 0.,01. Ismét, a gyakorlatban, akkor válasszon egy szignifikancia szinten, mielőtt a kísérlet, és ragaszkodni hozzá!
a 0, 05 szignifikanciaszintet alkalmazva a mintahatás statisztikailag szignifikáns. Adataink alátámasztják az alternatív hipotézist, amely kimondja, hogy a népesség átlaga nem egyenlő 260-mal. Megállapíthatjuk, hogy az üzemanyag-kiadások tavaly óta növekedtek.
A P értékeket nagyon gyakran félreértelmezik, mivel a null hipotézis elutasításának valószínűsége valójában igaz. Ez az értelmezés rossz! Ahhoz, hogy megértsük, miért, kérjük, olvassa el a hozzászólásomat: hogyan kell helyesen értelmezni a P-értékeket.,
A statisztikailag szignifikáns eredményekről szóló vita
hipotézis tesztek meghatározzák, hogy a mintaadatok elegendő bizonyítékot szolgáltatnak-e a teljes populáció nullhipotézisének elutasításához. A teszt elvégzéséhez az eljárás összehasonlítja a minta statisztikáját a null értékkel, majd meghatározza, hogy ez elég ritka-e. “Eléggé ritka” határozza meg egy hipotézis teszt:
- Feltételezve, hogy a null hipotézis igaz—a grafikonok központ a null értéket.
- a szignifikancia (alfa) szint – milyen messze van a null értéktől a kritikus régió?,
- a minta statisztika-ez a kritikus régióban?
nincs olyan különleges szignifikancia szint, amely helyesen határozza meg, hogy mely vizsgálatok valós populációs hatásokkal rendelkeznek az idő 100% – ában. A hagyományos szignifikancia szint 0,05 pedig 0.01 vagy megpróbálja kezelni a kompromisszum között, hogy kicsi a valószínűsége, elutasítása igaz, null hipotézis, amelyek megfelelő hatalom, hogy észleli a hatása, ha egy valóban létezik.
a szignifikancia szint az a sebesség, amellyel helytelenül elutasítja a null hipotéziseket, amelyek valójában igazak (I. típusú hiba)., Például minden olyan tanulmány esetében, amely 0,05-ös szignifikanciaszintet használ, és a null hipotézis helyes, 5% – uk számíthat arra, hogy a kritikus régióban csökken a minta statisztikája. Amikor ez a hiba bekövetkezik, nem tudja, hogy a null hipotézis helyes, de elutasítja, mert a p-érték kevesebb, mint 0,05.
Ez a hiba nem jelzi, hogy a kutató hibát követett el. Amint azt a grafikonok mutatják, a minta hibája miatt extrém mintavételi statisztikákat is megfigyelhet. Ez a sorsolás szerencséje!,
Kapcsolódó post: Típusú Hibák Hipotézis Tesztelése
Hipotézis vizsgálatok elengedhetetlen, ha szeretné használni a minta adatok, hogy a következtetéseket a lakosság, mert ezek a vizsgálatok számla minta hiba. A szignifikanciaszintek és a p értékek használata a nullhipotézis elutasításának meghatározásához javítja annak valószínűségét, hogy a helyes következtetést levonja.
ne feledje, hogy a statisztikai szignifikancia nem feltétlenül jelenti azt, hogy a hatás gyakorlati, valós értelemben fontos. További információkért olvassa el a gyakorlati vs. statisztikai jelentőségről szóló hozzászólásomat.,
Ha tetszik ez a bejegyzés, olvassa el a companion post: Hogyan hipotézis tesztek munka: konfidencia intervallumok és a bizalom szintje.
elolvashatja a többi hozzászólásomat is, amelyek leírják, hogyan működnek más tesztek:
- hogyan működnek a T-tesztek
- hogyan működik az F-teszt az ANOVA-ban
- hogyan működnek a Függetlenségi Chi-Négyzetes tesztek
a hagyományos hipotézisvizsgálat alternatív megközelítésének megtekintéséhez, amely nem használ valószínűségi eloszlásokat és tesztstatisztikákat, Ismerje meg a statisztikában a bootstrapping-ot!
Leave a Reply