revizuire
intervale de încredere și valori p
pentru a distra orice discuție despre analiza statistică, este important să înțelegem mai întâi conceptul de statistici ale populației. În mod clar, statisticile populației sunt valorile oricărei măsuri din cadrul populației de interes, iar estimarea acestora este obiectivul majorității studiilor ., De exemplu, într-un studiu privind ratele de obezitate pentru pacienții cu un anumit medicament, Statistica populației ar putea fi rata medie de obezitate pentru toți pacienții cu medicamente.cu toate acestea, identificarea acestei valori ar necesita date pentru fiecare individ care se încadrează în această categorie, ceea ce este impracticabil. În schimb, poate fi colectat un eșantion randomizat, din care pot fi obținute statistici de eșantion. Aceste statistici eșantion servesc ca estimări ale statisticilor populației corespunzătoare și permit unui cercetător să facă concluzii cu privire la o populație de interes.,există o limitare semnificativă prin faptul că aceste eșantioane construite trebuie să fie reprezentative pentru populația mai mare de interes. Deși există mulți pași care pot fi făcuți pentru a reduce această limitare, uneori efectele sale (așa-numita părtinire de eșantionare ) depășesc controlul cercetătorului. În plus, chiar și într-o situație teoretică fără părtinire de eșantionare, randomizarea ar putea duce la o probă de reprezentare greșită. În exemplul anterior, să presupunem că rata populației de obezitate în rândul tuturor adulților eligibili pentru Medicamente a fost de 25%., Într-un eșantion aleatoriu simplu de 30 de pacienți din această populație, există o șansă de 19,7% ca cel puțin 10 pacienți să fie obezi, rezultând o rată a obezității eșantionului de 33,3% sau chiar mai mare. Chiar dacă nu există nici o relație între medicamente și ratele de obezitate, este încă posibil să se întâlnească o rată care pare a fi diferită de rata globală a obezității, care a avut loc prin aleatorie în prelevarea de probe singur. Acest efect este motivul pentru raportarea intervalelor de încredere și a valorilor p în cercetarea clinică.
intervalele de încredere sunt intervale în care Statistica populației ar putea minți., Acestea sunt construite pe baza statisticii eșantionului și a anumitor caracteristici ale eșantionului care măsoară cât de probabil este să fie reprezentativ și sunt raportate la un anumit prag . Un interval de încredere de 95% este un interval construit astfel încât, în medie, 95% din eșantioanele aleatorii ar conține statistica reală a populației în intervalul lor de încredere de 95%. Astfel, un prag pentru rezultate semnificative este adesea luat ca 95%, înțelegând că toate valorile din intervalul raportat sunt la fel de valabile ca și statistica posibilă a populației.,valoarea p raportează informații similare într-un mod diferit. În loc să construiască un interval în jurul unei statistici a eșantionului, o valoare p raportează probabilitatea ca statistica eșantionului să fie produsă din eșantionarea aleatorie a unei populații, având în vedere un set de ipoteze despre populație, denumită „ipoteza nulă” ., Luând exemplul studiu privind ratele de obezitate din nou, rata obezității în rândul eșantionului (un eșantion de pacienți pe medicamente) ar putea fi raportate împreună cu un p-value determinarea șansă că o astfel de rată ar putea fi produs din întâmplare de eșantionare populația generală de pacienți eligibili pentru tratament. În cazul studiului, ipoteza nulă este că rata populației de obezitate în rândul pacienților cu medicamente este egală cu rata globală a obezității în rândul tuturor pacienților eligibili pentru medicamente, adică 25%., O valoare p cu o singură coadă poate fi utilizată dacă există motive să credem că un efect ar avea loc într-o singură direcție (de exemplu, pot exista motive să credem că medicamentul ar crește creșterea în greutate, dar nu ar scădea), în timp ce o valoare p cu două cozi ar trebui utilizată în toate celelalte cazuri. Atunci când se utilizează o distribuție simetrică, cum ar fi distribuția normală, valorile P cu două cozi sunt pur și simplu de două ori valoarea p cu o singură coadă.să presupunem din nou că un eșantion de 30 de pacienți cu medicamente conține 12 persoane obeze. Cu un test cu o singură coadă, valoarea noastră p este 0.0216 (folosind distribuția binomială)., Astfel, putem spune că rata noastră observată de 40% este semnificativ diferită de rata ipotezată de 25% la un nivel de semnificație de 0,05. Într-un alt sens, intervalul de încredere de 95% pentru proporția observată este de 25, 6% până la 61, 07%. Intervalele de încredere corespund testelor cu două cozi, unde un test cu două cozi este respins dacă și numai dacă intervalul de încredere nu conține valoarea asociată ipotezei nule (în acest caz, 25%).
dacă o valoare p calculată este mică, este probabil ca populația să nu fie structurată așa cum se menționează inițial în ipoteza nulă., Dacă obținem o valoare p scăzută, avem dovezi că a existat un efect sau un motiv pentru diferența observată – medicamentul, în acest caz. Se utilizează în mod obișnuit un prag de 0,05 (sau 5%), valoarea p trebuind să fie sub acest prag pentru ca atributul său corespunzător să fie semnificativ din punct de vedere statistic.riscul, un alt termen pentru probabilitate, este un alt principiu fundamental al analizei statistice. Probabilitatea este o comparație a observării unui eveniment specific care apare ca rezultat al rezultatelor unice totale., Un flip monedă este un exemplu banal: riscul de a observa un capete este ½ sau 50%, ca de toate studiile unice posibile (un flip care rezultă în capete sau un flip care rezultă în cozi), doar unul este evenimentul de interes (capete).utilizarea doar a riscului permite predicții despre o singură populație. De exemplu, analizând ratele de obezitate din populația SUA, CDC a raportat că 42.4% dintre adulți au fost obezi în 2017-2018. Deci, riscul ca un individ din SUA să fie obez este în jur de 42.4%. Cu toate acestea, majoritatea studiilor analizează efectul unei intervenții specifice sau al unui alt element (cum ar fi mortalitatea) asupra altui., Anterior, am presupus că rata obezității pacienților eligibili a fost de 25%, dar aici vom folosi 42.4% asociat cu populația adultă din SUA. Să presupunem că observăm un risc de 25% într-un eșantion aleatoriu de pacienți cu medicamente. Pentru a conceptualiza efectul medicației asupra obezității, un pas logic următor ar fi împărțirea riscului de obezitate în populația americană asupra medicamentelor cu riscul de obezitate în populația americană, ceea ce duce la un raport de risc de 0.590.,acest calcul – un raport de două riscuri-este ceea ce se înțelege prin statistica raportului de risc (RR), cunoscută și sub denumirea de risc relativ. Acesta permite un anumit număr să fie dat pentru cât de mult mai mult risc un individ într-o categorie poartă în comparație cu un individ într-o altă categorie. În exemplu, o persoană care ia medicamentul are un risc de 0,59 ori mai mare decât un adult din populația generală a SUA., Cu toate acestea, am presupus că populația eligibilă pentru Medicamente a avut o rată de obezitate de 25% – poate doar un grup de adulți tineri, care pot fi mai sănătoși în medie, sunt eligibili să ia medicamentul. Atunci când se investighează efectul medicamentelor asupra obezității, aceasta este proporția care ar trebui utilizată ca ipoteză nulă. Dacă observăm o rată a obezității la medicație de 40%, cu o valoare p mai mică decât nivelul de semnificație de 0, 05, aceasta este o dovadă că medicamentul crește riscul de obezitate (cu un RR, în acest scenariu, de 1, 6)., Ca atare, este important să alegeți cu atenție ipoteza nulă pentru a face predicții statistice relevante.cu RR, un rezultat al 1 semnifică faptul că ambele grupuri au același risc, în timp ce rezultatele nu sunt egale cu 1 indică faptul că un grup a avut un risc mai mare decât altul, un risc care se presupune că se datorează intervenției examinate de studiu (formal, presupunerea Direcției cauzale).pentru a ilustra, ne uităm la rezultatele unui studiu din 2009 publicat în Journal of Stroke and Cerebrovascular Diseases., Studiul raportează că pacienții cu un interval electrocardiografic prelungit QTc au fost mai predispuși la deces în decurs de 90 de zile, comparativ cu pacienții fără un interval prelungit (risc relativ =2,5; interval de încredere 95% 1,5-4,1) . Având un interval de încredere între 1, 5 și 4, 1 pentru raportul de risc indică faptul că pacienții cu un interval QTc prelungit au fost de 1, 5-4, 1 ori mai mari să moară în 90 de zile decât cei fără un interval QTc prelungit.,
Un al doilea exemplu – într-un punct de reper de hârtie care să demonstreze că curba tensiunii arteriale în accident vascular cerebral ischemic acut este în formă de U, mai degrabă decât în formă de J , anchetatorii au constatat că RR a crescut de aproape două ori mai mare la pacienții cu presiune sanguină arterială medie (MAP) >140 mmHg sau <100 mmHg (RR=1.8, 95% CI 1.1-2.9, p=0,027). Având un IÎ de 1,1-2,9 pentru RR înseamnă că pacienții cu o hartă în afara intervalului de 100-140 mmHg au fost de 1,1-2,9 ori mai multe sanse de a muri decât cei care au avut harta inițială în acest interval.,
Pentru un alt exemplu, un 2018 studiu Australian navale recruți a constatat că cei cu prefabricate orteze (un tip de picior de sprijin) a avut o 20.3% riscul de a suferi de cel puțin un efect negativ, în timp ce cei fara avut un risc de 12,4% . Un raport de risc aici este dat de 0.203 / 0.124 sau 1.63, sugerând că recruții cu orteze de picior poartă de 1.63 ori riscul de a avea unele consecințe adverse (de exemplu, blister de picior, durere etc.) decât cei fără. Cu toate acestea, același studiu raportează un interval de încredere 95% pentru riscul relativ de 0,96 la 2.76, cu o valoare p de 0,068., Privind intervalul de încredere, intervalul 95% raportat (standardul acceptat în mod obișnuit) include valori sub 1, 1 și valori peste 1. Amintind că toate valorile sunt la fel de susceptibile de a fi Statistica populației, la 95% încredere, nu există nicio modalitate de a exclude posibilitatea ca ortezele piciorului să nu aibă efect, să aibă un beneficiu semnificativ sau să aibă un prejudiciu semnificativ. În plus, valoarea p este mai mare decât standardul de 0,05, prin urmare, aceste date nu oferă dovezi semnificative ale ortezelor piciorului care au un efect consecvent asupra evenimentelor adverse, cum ar fi blistere și durere., După cum sa menționat anterior, aceasta nu este o coincidență – dacă sunt calculate folosind aceleași metode sau similare și valoarea p este cu două cozi, intervalele de încredere și valorile p vor raporta aceleași rezultate.atunci când sunt utilizate corect, rapoartele de risc sunt o statistică puternică care permite o estimare într-o populație a modificării riscului pe care o populație îl suportă față de alta., Acestea sunt destul de ușor de înțeles (valoarea este câte ori riscul unui grup poartă peste alta), și cu ipoteza de cauzalitate direcție, arată rapid dacă o intervenție (sau alte testat variabilă) are un efect asupra rezultatelor.cu toate acestea, există limitări. În primul rând, RRs nu poate fi aplicat în toate cazurile. Deoarece riscul într-un eșantion este o estimare a riscului într-o populație, eșantionul trebuie să fie rezonabil reprezentativ pentru populație. Ca atare, studiile de caz-control, prin simpla virtute a faptului că rapoartele rezultatelor sunt controlate, nu pot avea un raport de risc raportat., În al doilea rând, ca și în cazul tuturor statisticilor discutate aici, RR este o măsură relativă, oferind informații despre riscul dintr-un grup în raport cu altul. Problema aici este că un studiu în care două grupuri au avut un risc de 0, 2% și 0, 1% poartă același RR, 2, ca unul în care două grupuri au avut un risc de 90% și 45%. Deși în ambele cazuri este adevărat că cei cu intervenție au avut un risc de două ori mai mare, acest lucru echivalează cu doar 0.1% mai mult risc într-un caz, în timp ce 45% mai mult risc într-un alt caz., Astfel, raportarea numai a RR exagerează efectul în primă instanță, în timp ce poate chiar minimizarea efectului (sau cel puțin decontextualizarea acestuia) în a doua instanță.în timp ce riscul raportează numărul de evenimente de interes în raport cu numărul total de studii, cotele raportează numărul de evenimente de interes în raport cu numărul de evenimente care nu sunt de interes. Declarat diferit, raportează numărul de evenimente la nonevents., În timp ce riscul, stabilită anterior, de flipping o monedă pentru a fi cap este de 1:2 sau 50%, șansele de flipping o monedă pentru a fi cap este de 1:1, ca acolo este un rezultat dorit (eveniment), și unul nedorit rezultat (inexistent) (Figura 1).
la fel ca în cazul RR, unde raportul dintre două riscuri a fost luat pentru două grupuri separate, un raport de două Cote poate fi luat pentru două grupuri separate pentru a produce un, În loc să raporteze de câte ori riscul un grup poartă în raport cu celălalt, raportează de câte ori cotele un grup poartă la celălalt.pentru majoritatea, Aceasta este o statistică mai dificil de înțeles. Riscul este adesea un concept mai intuitiv decât cotele și, prin urmare, înțelegerea riscurilor relative este adesea preferată înțelegerii cotelor relative. Cu toate acestea, sau nu suferă de aceleași limitări de ipoteză cauzală ca RR, făcându-l mai larg aplicabil.,de exemplu, cotele sunt o măsură simetrică, ceea ce înseamnă că, în timp ce riscul examinează doar rezultatele intervențiilor Date, cotele pot examina și intervențiile date de rezultate. Astfel, un studiu poate fi construit în cazul în care, mai degrabă decât alegerea grupurilor de studiu și măsurarea rezultatelor, Rezultatele pot fi alese, și alți factori pot fi analizate. Următorul este un exemplu de studiu de caz-control, o situație în care RR nu poate fi utilizat, dar sau poate.un studiu de caz-control din 2019 se dovedește a fi un bun exemplu., În căutarea de a găsi posibile corelații între un virus hepatitic a (HAV) infecție proeminent în Canada și un factor cauzator, un studiu a fost construit pe baza rezultatului (cu alte cuvinte, indivizii au fost clasificate pe baza lor HAV stare, ca „intervenție”, sau de cauzalitate eveniment, a fost necunoscut). Studiul a analizat cei cu HAV și cei fără și ce alimente au mâncat înainte de infecția cu HAV . Din aceasta, au fost construite mai multe rate de cote comparând un anumit produs alimentar cu statutul HAV., De exemplu, datele au constatat că printre acei subiecți care au avut expunere la creveți/creveți, opt au fost pozitivi pentru HAV, în timp ce șapte nu au fost, în timp ce pentru cei fără expunere, doi au fost pozitivi pentru HAV, în timp ce 29 nu au fost. Un raport de Cote este luat de (8:7)/(2:29) ceea ce este egal cu aproximativ 16.6. Datele studiului au raportat o OR de 15.75, cu discrepanța mică probabil provenită din orice ajustări pre-calcul pentru variabilele confuze care nu au fost discutate în lucrare. A fost raportată o valoare p de 0,01, oferind astfel dovezi statistice pentru aceasta sau fiind semnificativă.,acest lucru poate fi interpretat în două moduri egale. În primul rând, șansele de expunere la creveți/creveți pentru cei cu HAV sunt de 15, 75 ori mai mari decât pentru cei fără. În mod echivalent, șansele pentru hav-posiitve față de HAV-negativ sunt de 15,75 ori mai mari pentru cei expuși la creveți/creveți decât pentru cei care nu sunt expuși.în general ,sau oferă o măsură a puterii de asociere între două variabile pe o scară de 1 fiind nici o asociere, de mai sus 1 fiind o asociere pozitivă, și sub 1 fiind o asociere negativă., În timp ce cele două interpretări anterioare sunt corecte, ele nu sunt la fel de ușor de înțeles cum ar fi fost un RR, dacă ar fi fost posibil să se determine una. O interpretare alternativă este că există o corelație pozitivă puternică între expunerea creveților/creveților și HAV.din acest motiv, în unele cazuri specifice, este necesar să se aproximeze RR cu sau. În astfel de cazuri, ipoteza bolii rare trebuie să dețină. Adică, o boală trebuie să fie extrem de rară în cadrul unei populații., În acest caz, riscul de boli în populație (p/(p+q)) se apropie de cotele de boli în populație (p/q) ca p devine nesemnificativ mic în raport cu q. Astfel, RR și SAU converg ca populația devine mai mare. Cu toate acestea, dacă această ipoteză nu reușește, diferența devine din ce în ce mai exagerată. Matematic, în studiile p + q, scăderea P crește q pentru a menține aceleași studii totale. Cu risc, numai numărătorul se schimbă, în timp ce cu cote, atât numărătorul, cât și numitorul se schimbă în direcții opuse., Ca urmare, pentru cazurile în care RR și OR sunt ambele sub 1, OR va subestima RR, în timp ce pentru cazurile în care ambele sunt peste 1, rup va supraestima RR.
raportarea greșită a OR ca RR, atunci, poate exagera adesea datele. Este important să ne amintim că sau este o măsură relativă la fel ca RR, și, astfel, uneori, o mare sau poate corespunde cu o mică diferență între cote.
pentru raportarea cea mai fidelă, atunci sau nu ar trebui să fie prezentată ca RR și ar trebui prezentată doar ca o aproximare a RR dacă ipoteza bolii rare poate ține în mod rezonabil., Dacă este posibil, trebuie raportată întotdeauna o RR.atât RR, cât și sau se referă la intervenții și rezultate, raportându-se astfel pe parcursul întregii perioade de studiu. Cu toate acestea, o măsură similară, dar distinctă, rata de risc (RR), se referă la ratele de schimbare (Tabelul 1).
Tabelul 1
RR | SAU | HR | |
Obiectiv | Determina relația în stare de risc pe baza unor variabile. | Determinați asocierea între două variabile. | Determinați cum se schimbă un grup în raport cu altul., |
Utilizare | ne spune cum modifică o intervenție riscurile. | ne spune dacă există o asociere între o intervenție și risc; estimează modul în care se aplică această asociere. | ne spune cum o intervenție modifică rata de experimentare a unui eveniment. |
limitări | aplicabile numai dacă designul studiului este reprezentativ pentru populație. Nu se poate utiliza pe studii de caz-control., | poate fi aplicat în general peste tot, dar nu întotdeauna o statistică utilă în sine. Exagerează riscurile. | Pentru a fi de obicei util, Rata de schimbare în cadrul a două grupuri ar trebui să fie relativ consistentă. |
Timeline | Static – nu ia în considerare ratele. Rezumă un studiu general. | Static – nu ia în considerare ratele. Rezumă un studiu general. | pe baza ratelor., Oferă informații despre modul în care un studiu progresează în timp. |
Ore sunt în tandem cu curbele de supraviețuire, care arată progresia temporală a unor evenimente în cadrul unui grup, fie că evenimentul este moartea, sau contractarea unei boli. Într-o curbă de supraviețuire, axa verticală corespunde evenimentului de interes, iar axa orizontală corespunde timpului. Pericolul evenimentului este apoi echivalent cu panta graficului sau cu evenimentele pe timp.o rată de pericol este pur și simplu o comparație a două pericole., Poate arăta cât de repede se diferențiază două curbe de supraviețuire prin compararea pantelor curbelor. Un HR de 1 nu indică nicio divergență – în ambele curbe, probabilitatea evenimentului a fost la fel de probabilă la un moment dat. Un HR care nu este egal cu 1 indică faptul că două evenimente nu au loc la o rată egală, iar riscul unui individ dintr-un grup este diferit de riscul unui individ dintr-un alt interval de timp dat.
o presupunere importantă pe care o fac HRs este ipoteza ratelor proporționale., Pentru a raporta o rată de pericol singulară, trebuie să se presupună că cele două rate de pericol sunt constante. Dacă panta graficului se va schimba, raportul se va schimba, de asemenea, în timp și, prin urmare, nu se va aplica ca o comparație a probabilității la un moment dat.luați în considerare studiul unui nou agent chimioterapeutic care încearcă să extindă speranța de viață a pacienților cu un anumit cancer. Atât în grupul de intervenție, cât și în cel de control, 25% au murit până în săptămâna 40., Deoarece ambele grupuri au scăzut de la supraviețuirea 100% la supraviețuirea 75% în perioada de 40 de săptămâni, ratele de pericol ar fi egale și, astfel, rata de pericol egală cu 1. Acest lucru sugerează că un individ care primește medicamentul este la fel de probabil să moară ca unul care nu primește medicamentul în orice moment.cu toate acestea, este posibil ca în grupul de intervenție, toți 25% au murit între săptămânile șase și 10, în timp ce pentru grupul de control, toți 25% au murit în săptămânile unu până la șase. În acest caz, Compararea medianilor ar afișa o speranță de viață mai mare pentru cei aflați pe medicament, în ciuda faptului că HR nu prezintă nicio diferență., În acest caz, ipoteza proporțională a pericolelor eșuează, deoarece ratele de pericol se schimbă (destul de dramatic) în timp. În astfel de cazuri, HR nu se aplică.deoarece uneori este dificil să se determine dacă ipoteza riscurilor proporționale se aplică în mod rezonabil și deoarece luarea unui HR elimină măsurarea inițială (ratele de pericol) ale unității de timp, este o practică obișnuită să se raporteze HR împreună cu timpii mediani.,
Într-un studiu evaluarea prognostică performanța Rapidă Medicină de Urgență Scor (REMS) și Worthing Fiziologice sistem de Notare (WPSS), anchetatorii au descoperit că riscul de a 30-a zi de mortalitate a crescut cu 30% pentru fiecare suplimentare REMS unitate (HR: 1.28; interval de încredere 95% (CI): 1.23-1.34) și de 60% pentru fiecare suplimentare WPSS unitate (HR: 1.6; IÎ 95%: 1.5-1.7). În acest caz, rata mortalității nu sa schimbat, ci mai degrabă sistemul de notare pentru a prezice că a făcut-o, astfel încât HR poate fi utilizat. Având un interval de încredere între 1,5 și 1.,7 pentru WPSS pericole raport indică faptul că curba mortalității pentru cei cu o mai mare WPS scade într-un ritm mai rapid (aproximativ 1,5-1,7 ori). Deoarece sfârșitul scăzut al intervalului este încă peste 1, suntem încrezători că adevăratul pericol de deces în termen de 30 de zile este mai mare pentru grupul cu WPS mai mare .într-un studiu din 2018 privind consumul de alcool în rândul persoanelor cu anumiți factori de risc, a fost construită o curbă de supraviețuire care trasează rata de realizare a consumului de alcool pentru controale, cei cu antecedente familiale, sex masculin, cei cu impulsivitate ridicată și cei cu un răspuns mai mare la alcool., Pentru bărbați și cei cu antecedente familiale, s-au raportat dovezi semnificative statistic pentru o rată mai mare de realizare a consumului de alcool (o RR de 1, 74 pentru bărbați și 1, 04 pentru cei cu antecedente familiale) . Cu toate acestea, pentru cei cu impulsivitate ridicată, deși HR a fost 1.17, intervalul de încredere de 95% a variat de la 1.00 la 1.37. Astfel, la un nivel de încredere de 95%, este imposibil să excludem că HR a fost 1.00.,
Pentru a exagerare prezent, este important să se evite reprezentând ORs ca RRs, și în mod similar, este important de a recunoaște că raportat SAU rareori oferă o bună aproximare a riscurile relative, ci mai degrabă pur și simplu oferă o măsură de corelare.datorită capacității sale de a face concluzii ferme și înțelegere, RR ar trebui să fie raportate dacă este posibil, cu toate acestea, în cazurile în care ipoteza de cauzalitate este încălcată (cum ar fi studii de caz de control și regresie logistică), sau pot fi utilizate.,
HRs sunt utilizate cu curbe de supraviețuire și presupun că ratele de pericol sunt egale în timp. Deși este util să se compare două rate, acestea ar trebui raportate cu timpi mediani pentru a justifica ipoteza proporțională a pericolelor.în cele din urmă, indiferent de valoarea HR/RR/sau statistică, o interpretare trebuie făcută numai după ce se determină dacă rezultatul oferă dovezi semnificative statistic către o concluzie (determinată de valoarea p sau intervalul de încredere)., Amintindu-și aceste principii și Cadrul HR / RR / sau minimizează denaturarea și împiedică unul să tragă concluzii incorecte din rezultatele unui studiu publicat cu privire la diferite eșantioane. Figura 2 rezumă utilizarea corectă și incorectă a acestor rapoarte de risc diferite.
Leave a Reply