Statisticile inferențiale vă permit să trageți concluzii despre populații folosind probe mici. În consecință, Statisticile inferențiale oferă beneficii enorme, deoarece de obicei nu puteți măsura o întreagă populație.cu toate acestea, pentru a obține aceste beneficii, trebuie să înțelegeți relația dintre populații, subpopulații, parametrii populației, eșantioane și statistici ale eșantioanelor.
în această postare pe blog, discut aceste concepte și modul de obținere a probelor reprezentative folosind eșantionarea aleatorie.,
Related post: diferența dintre statisticile Descriptive și inferențiale
populații
populațiile pot include oameni, dar alte exemple includ obiecte, evenimente, întreprinderi și așa mai departe. În statistici, există două tipuri generale de populații.populațiile pot fi setul complet al tuturor elementelor similare care există. De exemplu, populația unei țări include toate persoanele care se află în prezent în acea țară. Este o listă finită, dar potențial mare de membri.cu toate acestea, o populație poate fi un construct teoretic care este potențial infinit în dimensiune., De exemplu, analiștii de îmbunătățire a calității consideră adesea că toată producția actuală și viitoare dintr-o linie de producție face parte dintr-o populație.
populațiile împărtășesc un set de atribute pe care le definiți. De exemplu, următoarele sunt populații:
- stele din galaxia Calea Lactee.
- piese dintr-o linie de producție.
- cetățeni ai Statelor Unite.înainte de a începe un studiu, trebuie să definiți cu atenție populația pe care o studiați. Aceste populații pot fi definite în mod restrâns pentru a satisface nevoile analizei dvs., De exemplu, femeile suedeze adulte care sunt altfel sănătoase, dar au osteoporoză.
subpopulațiile pot îmbunătăți analiza
subpopulațiile Partajează atribute suplimentare. De exemplu, populația Statelor Unite conține subpopulații de bărbați și femei. Puteți, de asemenea, să o subdivizați în alte moduri, cum ar fi Regiunea, vârsta, statutul socio-economic și așa mai departe. Studiile diferite care implică aceeași populație o pot împărți în subpopulații diferite, în funcție de ceea ce are sens pentru date și analize.,
înțelegerea subpopulațiilor din studiul dvs. vă ajută să înțelegeți mai bine subiectul. De asemenea, vă pot ajuta să produceți modele statistice care se potrivesc mai bine datelor. Subpopulațiile sunt deosebit de importante atunci când au caracteristici care sunt sistematic diferite de populația totală. Când analizați datele, trebuie să fiți conștienți de aceste diviziuni mai profunde. De fapt, puteți trata subpopulațiile relevante ca factori suplimentari în analizele ulterioare.,de exemplu, dacă analizați înălțimea medie a adulților din Statele Unite, vă veți îmbunătăți rezultatele prin includerea subpopulațiilor masculine și feminine, deoarece înălțimea lor este sistematic diferită. Voi acoperi acest exemplu în profunzime mai târziu în acest post!
parametrii populației versus Statisticile eșantionului
un parametru este o valoare care descrie o caracteristică a întregii populații, cum ar fi media populației. Deoarece aproape niciodată nu puteți măsura o întreagă populație, de obicei nu cunoașteți valoarea reală a unui parametru., De fapt, valorile parametrilor sunt aproape întotdeauna necunoscute. Deși nu știm valoarea, cu siguranță există.de exemplu, înălțimea medie a femeilor adulte din Statele Unite este un parametru care are o valoare exactă—pur și simplu nu știm ce este!media populației și abaterea standard sunt doi parametri comuni. În statistici, simbolurile grecești reprezintă de obicei parametrii populației, cum ar fi μ (mu) pentru medie și σ (sigma) pentru abaterea standard.
o statistică este o caracteristică a unui eșantion., Dacă colectați un eșantion și calculați abaterea medie și standard, acestea sunt statistici de eșantion. Statisticile inferențiale vă permit să utilizați statistici eșantion pentru a face concluzii despre o populație. Cu toate acestea, pentru a trage concluzii valide, trebuie să utilizați anumite tehnici de eșantionare. Aceste tehnici ajută la asigurarea faptului că eșantioanele produc estimări imparțiale. Estimările părtinitoare sunt sistematic prea mari sau prea mici. Vrei estimări imparțiale, deoarece acestea sunt corecte în medie.
în Statisticile inferențiale, folosim statistici eșantion pentru a estima parametrii populației., De exemplu, dacă colectăm un eșantion aleatoriu de femei adulte din Statele Unite și le măsurăm înălțimile, putem calcula media eșantionului și o putem folosi ca o estimare imparțială a mediei populației. De asemenea, putem efectua testarea ipotezelor pe estimarea eșantionului și putem crea intervale de încredere pentru a construi un interval în care valoarea reală a populației se încadrează probabil.,div id=”6aadacc401″>
Mu (μ)
: Measures of Central Tendency and Measures of Variability
Representative Sampling and Simple Random Samples
In statistics, sampling refers to selecting a subset of a population., După desenarea eșantionului, măsurați una sau mai multe caracteristici ale tuturor elementelor din eșantion, cum ar fi înălțimea, venitul, temperatura, opinia etc. Dacă doriți să trageți concluzii cu privire la aceste caracteristici în întreaga populație, aceasta impune restricții asupra modului în care colectați eșantionul. Dacă utilizați o metodologie incorectă, eșantionul ar putea să nu reprezinte populația, ceea ce vă poate duce la concluzii eronate.metoda cea mai cunoscută pentru a obține un eșantion imparțial, reprezentativ este eșantionarea simplă aleatorie., Cu această metodă, toate elementele din populație au o probabilitate egală de a fi selectate. Acest proces ajută la asigurarea faptului că eșantionul include întreaga gamă a populației. În plus, toate subpopulațiile relevante ar trebui să fie încorporate în eșantion și reprezentate cu precizie în medie. Eșantionarea simplă aleatorie minimizează părtinirea și simplifică analiza datelor.
voi discuta metodologia de eșantionare în detaliu într-o postare viitoare pe blog, dar există mai multe avertismente cruciale cu privire la eșantionarea simplă aleatorie., În timp ce această abordare minimizează prejudecată, aceasta nu indică faptul că statisticile eșantion egal exact parametrii populației. În schimb, estimările dintr-un eșantion specific sunt susceptibile de a fi puțin ridicate sau scăzute, dar procesul produce estimări exacte în medie. În plus, este posibil să se obțină probe neobișnuite cu eșantionare aleatorie—nu este doar rezultatul așteptat.
Related post: statisticile de eșantion sunt întotdeauna greșite (într-o oarecare măsură)!în plus, eșantionarea aleatorie ar putea părea puțin întâmplătoare și ușor de făcut—ambele nu sunt adevărate., Eșantionarea simplă aleatorie presupune că compilați sistematic o listă completă a tuturor persoanelor sau elementelor care există în populație. Apoi selectați aleatoriu subiecte din această listă și să le includă în eșantion. Poate fi un proces foarte greoi.să aducem aceste concepte la viață!
exemplu de populație cu subpopulații importante
Să presupunem că studiem înălțimea cetățenilor americani și să presupunem în continuare că nu știm prea multe despre subiect., În consecință, colectăm un eșantion aleatoriu, măsurăm înălțimile în centimetri și calculăm media eșantionului și abaterea standard. Aici este fișierul de date CSV: Heights.
Vom obține următoarele rezultate:
Pentru că ne-am adunat un eșantion aleator, putem presupune că aceste exemple de statistici sunt imparțiale estimări ale parametrilor populației.acum, să presupunem că învățăm mai multe despre zona de studiu și includem bărbații și femeile ca subpopulații. Obținem următoarele rezultate.,
Observați cum singur largă distribuție a fost înlocuit cu două mai înguste distribuții? Distribuția pentru fiecare sex are o abatere standard mai mică decât distribuția unică pentru toți adulții, ceea ce este în concordanță cu răspândirea mai strânsă în jurul mijloacelor atât pentru bărbați, cât și pentru femei din grafic. Aceste rezultate arată modul în care media oferă estimări mai precise atunci când evaluăm înălțimile în funcție de sex. De fapt, media pentru întreaga populație nu este egală cu media pentru nici o subpopulație. Este înșelătoare!,în timpul acestui proces, aflăm că genul este o subpopulație crucială care se referă la înălțime și ne crește înțelegerea subiectului. În studiile viitoare despre înălțime, putem include sexul ca variabilă predictor.
Acest exemplu folosește o variabilă de grupare categorică (gen) și o variabilă de rezultat continuu (înălțimi). Când doriți să comparați distribuțiile de valori continue între grupuri ca acest exemplu, luați în considerare utilizarea boxplots și parcele de valoare individuale. Aceste parcele devin mai utile pe măsură ce numărul de grupuri crește.,acest exemplu este intenționat ușor de înțeles, dar imaginați-vă un studiu despre un subiect mai puțin evident. Acest proces vă ajută să obțineți noi perspective și să produceți modele statistice mai bune.folosind cunoștințele dvs. despre populații, subpopulații, parametri, eșantionare și statistici de eșantionare, puteți trage concluzii valoroase despre populațiile mari folosind eșantioane mici. Pentru mai multe informații despre modul în care puteți testa ipoteze despre populații, citiți prezentarea generală a testelor de ipoteze.
Leave a Reply