Chi-Square Statistic: How to Calculate It / Distribution
waargenomen variabelen: definitie
inhoud
definities
- Wat is een Chi vierkantstest?
- Wat is een Chi-kwadraat statistiek?
- Chi kwadraat P-waarden.
- de Chi-kwadraatverdeling & Chi-verdeling
berekeningen:
- Hoe een Chi-Kwadraatstatistiek te berekenen:
- Met de Hand (met video)
- SPSS-instructies.,
- Hoe Test je een Chi-Kwadraathypothese (met video)
zie ook:
- Chi-kwadraattest voor normaliteit.
Wat is een Chi-Kwadraattest?
Er zijn twee soorten chi-kwadraattesten. Beide gebruiken de chi-kwadraat statistiek en distributie voor verschillende doeleinden:
- Een chi-kwadraat goedheid van fit test bepaalt of de steekproefgegevens overeenkomen met een populatie. Voor meer informatie over dit type, zie: Goodness of Fit Test.
- een chi-kwadraattest voor onafhankelijkheid vergelijkt twee variabelen in een contingentietabel om te zien of ze gerelateerd zijn., In een meer algemene zin, het test om te zien of distributies van categorische variabelen verschillen van elkaar.
- Een zeer kleine chi kwadraat test statistiek betekent dat uw waargenomen gegevens zeer goed aansluiten bij uw verwachte gegevens. Met andere woorden, er is een relatie.
- een zeer grote chi-kwadraatteststatistiek betekent dat de gegevens niet erg goed passen. Met andere woorden, er is geen relatie.
terug naar boven
Wat is een Chi-kwadraat statistiek?,
De formule voor de chi-kwadraatstatistiek die in de chi-kwadraattest wordt gebruikt, is:
De chi-kwadraatformule.
het subscript ” c ” is de vrijheidsgraden. “O” is uw waargenomen waarde en E is uw verwachte waarde. Het is zeer zeldzaam dat je deze formule daadwerkelijk wilt gebruiken om een kritische chi-kwadraatwaarde met de hand te vinden. Het sommatiesymbool betekent dat u een berekening moet uitvoeren voor elk afzonderlijk gegevensitem in uw gegevensverzameling. Zoals u zich waarschijnlijk kunt voorstellen, kunnen de berekeningen zeer, zeer, lang en vervelend worden., In plaats daarvan zult u waarschijnlijk technologie willen gebruiken:
- Chi Kwadraattest in SPSS.
- Chi Square P-waarde in Excel.
een Chi-kwadraat statistiek is een manier om een relatie tussen twee categorische variabelen weer te geven. In de statistiek zijn er twee soorten variabelen: numerieke (aftelbare) variabelen en niet-numerieke (categorische) variabelen. De chi-kwadraat statistiek is een enkel getal dat je vertelt hoeveel verschil Er bestaat tussen je waargenomen tellingen en de tellingen die je zou verwachten als er helemaal geen relatie in de bevolking.,
er zijn enkele variaties op de chi-kwadraat statistiek. Welke je gebruikt hangt af van hoe je de gegevens verzamelde en welke hypothese wordt getest. Echter, alle variaties gebruiken hetzelfde idee, dat is dat u uw verwachte waarden vergelijkt met de waarden die u daadwerkelijk verzamelt. Een van de meest gebruikte formulieren kan worden gebruikt voor contingency tables:
waarbij O de waargenomen waarde is, E de verwachte waarde en “i” de “IDE” positie in de contingency table.,
een lage waarde voor het chi-kwadraat betekent dat er een hoge correlatie is tussen uw twee reeksen gegevens. In theorie, als uw waargenomen en verwachte waarden gelijk waren (“geen verschil”) dan zou chi-kwadraat nul zijn — een gebeurtenis die waarschijnlijk niet zal gebeuren in het echte leven. Beslissen of een chi-kwadraat test statistiek groot genoeg is om een statistisch significant verschil aan te geven is niet zo makkelijk het lijkt. Het zou mooi zijn als we konden zeggen dat een chi-kwadraat test statistiek >10 een verschil betekent, maar helaas is dat niet het geval.,
u kunt uw berekende chi-kwadraatwaarde vergelijken met een kritische waarde uit een Chi-kwadraattabel. Als de chi-kwadraat waarde meer is dan de kritische waarde, dan is er een significant verschil.
u kunt ook een p-waarde gebruiken. Stel eerst de nulhypothese en de alternatieve hypothese. Genereer dan een chi-kwadraatcurve voor je resultaten samen met een p-waarde (zie: Bereken een chi-kwadraat p-waarde Excel). Kleine p-waarden (minder dan 5%) geven meestal aan dat een verschil significant is (of “klein genoeg”).
Tip: De Chi-kwadraat statistiek kan alleen worden gebruikt op getallen., Ze kunnen niet worden gebruikt voor percentages, verhoudingen, middelen of soortgelijke statistische waarden. Als je bijvoorbeeld 10 procent van de 200 mensen hebt, moet je dat converteren naar een getal (20) voordat je een teststatistiek kunt uitvoeren.
Terug naar boven
Chi kwadraat P-waarden.
een chi-kwadraattest geeft u een p-waarde. De p-waarde zal u vertellen of uw testresultaten significant zijn of niet. Om een chi-kwadraattest uit te voeren en de p-waarde te krijgen, heb je twee informatiestukken nodig:
- vrijheidsgraden. Dat is gewoon het aantal categorieën min 1.
- het alfaniveau (α)., Dit wordt gekozen door u, of de onderzoeker. Het gebruikelijke alfaniveau is 0,05 (5%), maar je kunt ook andere niveaus hebben zoals 0.01 of 0.10.
in elementaire statistieken of AP-statistieken worden meestal zowel de vrijheidsgraden(DF) als het alfaniveau aan u gegeven in een vraag. Je hoeft normaal niet uit te zoeken wat ze zijn. Je moet de df misschien zelf uitzoeken, maar het is vrij eenvoudig: tel de categorieën en trek 1 af.,
vrijheidsgraden worden als subscript na het chi-vierkant (Χ2) symbool geplaatst. Het volgende chi-kwadraat toont bijvoorbeeld 6 df:
Χ26.
en dit chi-kwadraat toont 4 df:
Χ24.,
Terug naar Boven
De Chi-Kwadraat Verdeling
Door Geek3|Wikimedia Commons GFDL
De chi-kwadraat verdeling (ook wel chi-kwadraat verdeling) is een speciaal geval van de gamma verdeling; Een chi-kwadraat verdeling met n vrijheidsgraden is gelijk aan een gamma verdeling met a = n / 2 en b = 0,5 (of β = 2).
stel dat je een willekeurige steekproef hebt genomen van een normale distributie. De chi kwadraat verdeling is de verdeling van de som van deze willekeurige monsters kwadraat ., De vrijheidsgraden (k) zijn gelijk aan het aantal monsters dat wordt opgeteld. Als je bijvoorbeeld 10 monsters hebt genomen van de normale verdeling, dan is df = 10. De vrijheidsgraden in een chi kwadraat verdeling is ook het gemiddelde. In dit voorbeeld zal het gemiddelde van deze specifieke verdeling 10 zijn. Chi square distributies zijn altijd recht scheef. Echter, hoe groter de vrijheidsgraden, hoe meer de chi square verdeling eruit ziet als een normale verdeling.,
gebruik
De chi-kwadraat verdeling heeft vele toepassingen in de statistieken, waaronder:
- schatting van het betrouwbaarheidsinterval voor een populatie standaardafwijking van een normale verdeling ten opzichte van een steekproef standaardafwijking.
- onafhankelijkheid van twee criteria voor de indeling van kwalitatieve variabelen.
- relaties tussen categorische variabelen (contingency tables).
- variantieonderzoek in het monster wanneer de onderliggende verdeling normaal is.
- tests van afwijkingen van verschillen tussen verwachte en waargenomen frequenties (eenrichtingstabellen).,
- de chi-kwadraattest (een “goodness of fit” – test).
Chi-verdeling
een soortgelijke verdeling is de Chi-verdeling. Deze verdeling beschrijft de vierkantswortel van een variabele verdeeld volgens een chi-kwadraat verdeling.; met df = n > 0 vrijheidsgraden heeft een kansdichtheidsfunctie van:
f(x) = 2(1-n/2) x(n-1) e(-(x2)/2) / Γ(n/2)
voor waarden waarbij x positief is.,
de cdf voor deze functie heeft geen gesloten vorm, maar kan worden benaderd met een reeks integralen, met behulp van calculus.
Back to Top
hoe een Chi-Kwadraatstatistiek te berekenen
een Chi-kwadraatstatistiek wordt gebruikt voor het testen van hypothesen. Bekijk deze video, hoe je een Chi-vierkant te berekenen, of lees de onderstaande stappen. Nog steeds problemen? Chegg.com zal je matchen met een tutor, en je eerste 30 minuten is gratis!
De chi-kwadraatformule.
De chi-kwadraatformule is een moeilijk te hanteren formule. Dat komt vooral omdat er van je wordt verwacht dat je een grote hoeveelheid getallen toevoegt. De eenvoudigste manier om de formule op te lossen is door een tabel te maken.
Stap 2: Vul uw categorieën in. Categorieën moeten worden gegeven aan u in de vraag. Er zijn 12 dierenriemtekens, dus:
Stap 3: schrijf uw tellingen. Tellingen zijn het aantal items in elke categorie in kolom 2., U krijgt de tellingen in de vraag:
Stap 4: Bereken uw verwachte waarde voor kolom 3. In deze vraag zouden we verwachten dat de 12 tekens van de dierenriem gelijkmatig verdeeld zijn voor alle 256 mensen, dus 256/12=21.333. Schrijf dit in kolom 3.
Stap 5: trek de verwachte waarde (Stap 4) af van de waargenomen waarde (Stap 3) en plaats het resultaat in de kolom” Rest”. Bijvoorbeeld, de eerste rij is Ram: 29-21. 333=7.667.,
Stap 6: vierkant uw resultaten uit Stap 5 en plaats de bedragen in de kolom (Obs-Exp)2.
Stap 7: Deel de bedragen in Stap 6 door de verwachte waarde (Stap 4) en plaats deze resultaten in de laatste kolom.
Stap 8: Tel alle waarden op in de laatste kolom.
Dit is de chi-kwadraat statistiek: 5.094.
zoals de uitleg?, Check out de Practically Cheating Statistics Handbook, die honderden meer stap-voor-stap uitleg heeft, net als deze!
Back to Top
SPSS instructies.
u vindt de chi-kwadraattest in SPSS onder “Crosstabs”.
voorbeeldprobleem: voer een chi-kwadraattest uit in SPSS.
OPMERKING: Om een chi-kwadraat test in SPSS uit te voeren moet u al een hypothese statement hebben geschreven. Zie: hoe de nulhypothese te stellen.
bekijk de video of lees de onderstaande stappen:
Stap 1: klik op “Analyseren”, klik vervolgens op” beschrijvende statistieken”, klik vervolgens op “Crosstabs”.”
Chi square in SPSS is te vinden in het Crosstabs Commando.
Stap 2: Klik op de knop “statistieken”. De knop statistieken bevindt zich rechts van het venster Crosstabs. Er verschijnt een nieuw pop-upvenster.
Stap 3: Klik op” Chi Square “om een selectievakje te plaatsen en klik vervolgens op” Continue ” om terug te keren naar het venster Crosstabs.,
Stap 4: Selecteer de variabelen die u wilt uitvoeren (met andere woorden, kies twee variabelen die u wilt vergelijken met behulp van de chi-kwadraattest). Klik op een variabele in het linkervenster en klik vervolgens op de pijl bovenaan om de variabele te verplaatsen naar “rij(en).”Herhaal om een tweede variabele toe te voegen aan het venster “Column(s)”.
Stap 5: Klik op ” cells “en vink vervolgens” Rows “en”Columns” aan. Klik Op ” Doorgaan.”
Stap 6: Klik op ” OK ” om de Chi-Kwadraattest uit te voeren. De Chi Square tests zullen worden geretourneerd aan de onderkant van het uitvoerblad in de “Chi Square Tests” doos.,
Stap 7: vergelijk de p-waarde geretourneerd in het chi-kwadraat gebied (vermeld in de asymp Sig kolom) met het door u gekozen alfaniveau.
terug naar boven
Bekijk ons YouTube-kanaal voor meer hulp met statistieken. Vind tientallen video ‘ s over basisstatistieken principes plus hoe je statistieken kunt berekenen met behulp van Microsoft Excel.
hoe Test je een Chi-Kwadraathypothese (test voor onafhankelijkheid)
bekijk de video, of lees de onderstaande stappen:
een chi-kwadraattest voor onafhankelijkheid laat zien hoe categorische variabelen gerelateerd zijn., Er zijn een paar variaties op de statistiek; welke u gebruikt hangt af van hoe u de gegevens verzameld. Het hangt ook af van hoe je hypothese wordt geformuleerd. Alle variaties gebruiken hetzelfde idee; je vergelijkt de waarden die je verwacht te krijgen (verwachte waarden) met de waarden die je daadwerkelijk verzamelt (waargenomen waarden). Een van de meest voorkomende vormen kan worden gebruikt in een contingency table.
De chi – kwadraathypothese test is geschikt als u:
- Discrete uitkomsten (categorisch.)
- dichotome variabelen.
- ordinale variabelen.,
u kunt bijvoorbeeld een klinisch onderzoek hebben met de resultaten van hypoglykemie, normoglycemie of hyperglycemie in het bloed.
Test een Chi-Kwadraathypothese: stappen
Monstervraag: Test de Chi-kwadraathypothese met de volgende kenmerken:
- 11 vrijheidsgraden
- Chi-kwadraatteststatistiek van 5.094
opmerking: vrijheidsgraden is gelijk aan het aantal categorieën min 1.
Stap 1: Neem de chi-kwadraat statistiek. Zoek de p-waarde in de chi-vierkante tabel., Als u niet bekend bent met chi-square tafels, de chi square table link bevat ook een korte video over hoe de tafel te lezen. De dichtstbijzijnde waarde voor df=11 en 5.094 ligt tussen .900 en .950.
Opmerking: De chi – vierkante tabel biedt geen exacte waarden voor elke mogelijkheid. Als u een rekenmachine gebruikt, kunt u een exacte waarde krijgen. De exacte p-waarde is 0,9265.
Stap 2: Gebruik de p-waarde die u in Stap 1 hebt gevonden. Beslis of de nulhypothese wordt ondersteund of afgewezen., In het algemeen zouden kleine p-waarden (1% tot 5%) ervoor zorgen dat u de nulhypothese afwijst. Deze zeer grote p-waarde (92,65%) betekent dat de nulhypothese niet moet worden afgewezen.
zoals de uitleg? Check out de Practically Cheating Statistics Handbook, die honderden meer stap-voor-stap uitleg heeft, net als deze!
Back to Top
Reference
Johns Hopkins.Kenney, J. F. and Keeping, E. S. Mathematics of Statistics, Pt. 2, 2nd ed. Princeton, NJ: van Nostrand, 1951.,
——————————————————————————eeft u hulp nodig met een huiswerk-of testvraag? Met Chegg Study krijgt u stap-voor-stap oplossingen voor uw vragen van een expert in het veld. Je eerste 30 minuten met een Chegg tutor is gratis!
Leave a Reply