Review
intervaly spolehlivosti a hodnoty p
pro pobavení jakékoli diskuse o statistické analýze je důležité nejprve pochopit koncept statistiky populace. Jasně, statistiky populace jsou hodnoty jakéhokoli opatření v rámci populace zájmu, a jejich odhad je cílem většiny studií ., Například, ve studii zaměřené na výskyt obezity u pacientů na určité léky, populační statistika by mohla být průměrná obezity u všech pacientů na léky.
identifikace této hodnoty by však vyžadovala mít údaje pro každého jednotlivce, který spadá do této kategorie, což je nepraktické. Místo toho lze shromáždit randomizovaný vzorek, ze kterého lze získat statistiky vzorků. Tyto ukázkové statistiky slouží jako odhady odpovídajících populačních statistik a umožnit, aby pracovník dělat závěry o populaci zájem.,
existuje významné omezení v tom, že tyto konstruované vzorky musí být reprezentativní pro větší populaci zájmu. I když existuje mnoho kroků, které lze podniknout ke snížení tohoto omezení, někdy jeho účinky (tzv. Navíc i v teoretické situaci bez výběrového zkreslení by randomizace mohla vést ke zkreslenému vzorku. V předchozím příkladu, předpokládejme, že populace míra obezity mezi všemi dospělými nárok na léky byly o 25%., V jednoduchém náhodném vzorku 30 pacientů z této populace, tam je 19.7% šanci, že alespoň 10 pacientů bude obézní, což vede ve vzorku obezita sazba 33,3%, nebo dokonce vyšší. I když neexistuje žádný vztah mezi léky a obezity, je stále možné, že narazíte na kurz, který se zdá být odlišný od celkové obezity, k níž došlo prostřednictvím náhodnosti vzorků sám. Tento účinek je důvodem pro hlášení intervalů spolehlivosti a hodnot p v klinickém výzkumu.
intervaly spolehlivosti jsou intervaly, ve kterých by statistika populace mohla ležet., Jsou konstruovány na základě statistiky vzorku a určitých vlastností vzorku, které odhadují, jak je pravděpodobné, že bude reprezentativní, a jsou hlášeny na určitou prahovou hodnotu . Interval spolehlivosti 95% je interval konstruovaný tak, že v průměru 95% náhodných vzorků by obsahovalo skutečnou statistiku populace v jejich intervalu spolehlivosti 95%. Prahová hodnota pro významné výsledky je tedy často považována za 95%, s vědomím, že všechny hodnoty v hlášeném rozsahu jsou stejně platné jako možná statistika populace.,
hodnota p vykazuje podobné informace jiným způsobem. Spíše než budování intervalu kolem vzorku statistika p-hodnota hlášení pravděpodobnost, že vzorek statistika byla vyrobena z náhodného výběru z populace, vzhledem k tomu, soubor předpokladů o populaci, odkazoval se na jako „nulová hypotéza“ ., Na příkladu studie o obezitě sazby znovu, míra obezity mezi vzorek (vzorek pacientů na léky), může být hlášena společně s p-hodnota určující pravděpodobnost, že tato sazba může být vyroben z náhodně podívá na celkové populaci pacientů způsobilých pro léky. V případě studie, nulová hypotéza je, že populace míra obezity mezi pacienty na léky rovná se celková míra obezity mezi pacienty způsobilé pro léky, to znamená, že 25%., One-tailed p-hodnota může být použita, pokud existuje důvod se domnívat, že efekt by nastal pouze v jednom směru (například, tam může být důvod domnívat se, že lék by zvýšení tělesné hmotnosti, ale ne snížit), vzhledem k tomu, že two-tailed p-hodnota by měla být používána ve všech ostatních případech. Při použití symetrického rozdělení, například normální rozdělení, two-tailed p-hodnoty jsou jednoduše dvakrát one-tailed p-value.
Předpokládejme znovu, že vzorek 30 pacientů léčených přípravkem obsahuje 12 obézních jedinců. Při testu s jedním ocasem je naše hodnota p 0.0216 (pomocí binomické distribuce)., Můžeme tedy říci, že naše pozorovaná míra 40% se výrazně liší od předpokládané míry 25% na úrovni významnosti 0,05. V jiném smyslu, 95% interval spolehlivosti pro pozorovaný podíl 25,6% 61.07%. Intervaly spolehlivosti odpovídají two-tailed testy, kde dvoustranný test je zamítnuta, jestliže a pouze jestliže interval spolehlivosti neobsahuje hodnotu přiřazenou nulové hypotézy (v tomto případě 25%).
Pokud je vypočtená hodnota p malá, je pravděpodobné, že populace není strukturována, jak bylo původně uvedeno v nulové hypotéze., Pokud získáme nízkou hodnotu p, máme důkaz, že došlo k nějakému účinku nebo důvodu pozorovaného rozdílu – léku, v tomto případě. Obvykle se používá prahová hodnota 0,05 (nebo 5%), přičemž hodnota p musí být pod touto prahovou hodnotou, aby její odpovídající atribut byl statisticky významný.
rizikové poměry
riziko, další termín pro pravděpodobnost, je dalším základním principem statistické analýzy. Pravděpodobnost je srovnání pozorování konkrétní události, ke které dochází v důsledku celkových jedinečných výsledků., Mince je triviální příklad: riziko pozorování hlavy je ½ nebo 50%, jak ze všech možných unikátní studiích (flip, což v hlavách, nebo flip, což v ocasy), jen jeden je v případě zájmu (hlavy).
použití pouze rizika umožňuje předpovědi o jedné populaci. Například při pohledu na míru obezity v americké populaci CDC uvedla, že v letech 2017-2018 bylo obézních 42, 4% dospělých. Takže riziko, že jedinec v USA bude obézní, se pohybuje kolem 42,4% . Většina studií se však zabývá účinkem konkrétního zásahu nebo jiné položky (jako je mortalita) na jinou., Dříve jsme předpokládali, že míra obezity způsobilých pacientů byla 25%, ale zde použijeme 42, 4% spojené s dospělou populací v USA. Předpokládejme, že pozorujeme riziko 25% v náhodném vzorku pacientů na léky stejně. Pojem účinek léků na obezitu, dalším logickým krokem by bylo rozdělení riziko obezity v populaci USA na léky s rizikem obezity v AMERICKÉ populaci, což má za následek riziko, poměr 0.590.,
tento výpočet-poměr dvou rizik-je to, co se rozumí statistikou eponymous risk ratio (RR), známou také jako relative risk. Umožňuje určit konkrétní číslo, o kolik větší riziko nese jednotlivec v jedné kategorii ve srovnání s jednotlivcem v jiné kategorii. V příkladu jedinec užívající léky nese 0,59 krát větší riziko než dospělý z obecné americké populace., Předpokládali jsme však, že populace způsobilá pro léčbu měla míru obezity 25% – snad pouze skupina mladých dospělých, kteří mohou být v průměru zdravější, jsou způsobilí užívat léky. Při zkoumání účinku léku na obezitu je to poměr, který by měl být použit jako nulová hypotéza. Pokud pozorujeme míru obezity u léků o 40%, s hodnotou p nižší než úroveň významnosti 0,05, je to důkaz, že lék zvyšuje riziko obezity (s RR, v tomto scénáři, 1,6)., Proto je důležité pečlivě zvolit nulovou hypotézu, aby se vytvořily relevantní statistické předpovědi.
S RR, výsledek 1 znamená, že obě skupiny mají stejné množství rizik, zatímco výsledky není rovno 1, ukazují, že jedna skupina nesla větší riziko než jiný, riziko, že se předpokládá, že v důsledku intervence zkoumána ve studii (formálně, předpoklad kauzální směr).
Pro ilustraci se podíváme na výsledky studie z roku 2009 zveřejněná v Journal of cévní mozkové příhody a Cerebrovaskulární Onemocnění., Studie uvádí, že pacienti s delší ekg Qt interval byly více pravděpodobné, že zemřou do 90 dnů ve srovnání s pacienty bez delším intervalu (relativní riziko =2.5; 95% interval spolehlivosti 1.5-4.1) . S konfidenční interval mezi 1,5 a 4.1 pro poměr rizika naznačuje, že u pacientů s prodloužením QTc intervalu byl 1,5-4,1 krát více pravděpodobné, že zemřou v 90 dní, než ti bez prodloužený QTc interval.,
druhý příklad – v mezník papír prokazující, že krevní tlak křivky v akutní ischemické cévní mozkové příhody je ve tvaru U, spíše než ve tvaru písmene J , vyšetřovatelé zjistili, že RR se zvýšila téměř dvojnásobně u pacientů se střední arteriální krevní tlak (MAP) >140 mmHg nebo <100 mmHg (RR=1.8, 95% CI 1.1-2.9, p=0.027). Mít CI 1,1 – 2,9 pro RR znamená, že pacienti s mapou mimo rozsah 100-140 mmHg byli 1,1-2,9 krát častěji umírat než ti, kteří měli počáteční mapu v tomto rozmezí.,
Pro další příklad, 2018 studovat na Australské námořní rekruty zjistili, že ti s prefabrikované ortézy (typ podpory nohy), měl 20.3% riziko trpí nejméně jeden nežádoucí účinek, zatímco ti, aniž by měla riziko o 12,4% . Riziko, poměr je dán 0.203/0.124, nebo 1.63, což naznačuje, že rekruti s nožní ortézy vrtání 1.63 krát riziko, že některé nežádoucí následky (např. nohy puchýř, bolest, atd.) než ti bez. Nicméně, stejný obor hlásí 95% interval spolehlivosti pro poměr rizik 0.96 do 2,76, s p-hodnotou 0.068., Při pohledu na interval spolehlivosti obsahuje 95% hlášený rozsah (běžně přijímaný standard) hodnoty pod 1, 1 a hodnoty nad 1. Připomenout, že všechny hodnoty jsou stejně pravděpodobné, že bude populační statistika, na 95% jistotu, není tam žádný způsob, jak vyloučit možnost, že nohy ortézy neměly žádný efekt mít značný prospěch, nebo mají významné škodě. Navíc, p-hodnota je větší než standardní 0,05, proto tato data neposkytuje významné důkazy, nožní ortézy s konzistentní účinek na nežádoucí účinky, jako jsou puchýře a bolest., Jak již bylo uvedeno výše, není to náhoda – pokud jsou vypočteny pomocí stejných nebo podobných metod a hodnota p je dvouocasá, intervaly spolehlivosti a hodnoty p budou vykazovat stejné výsledky.
Když se používá správně, riziko poměry jsou silné statistiky, které umožňují odhad v populaci, změny v rizikových jedné populace medvědů nad jiné., Oni jsou docela snadné pochopit (hodnota je kolikrát riziko jedna skupina nese přes další), a s předpokladem kauzální směr, rychle ukázat, zda zásah (nebo jiná testovaná proměnná) má vliv na výsledky.
existují však omezení. Za prvé, RRs nelze použít ve všech případech. Protože riziko ve vzorku je odhad rizika v populaci, musí být vzorek dostatečně reprezentativní populace. Studie případové kontroly jako takové nemohou jednoduše na základě skutečnosti, že poměry výsledků jsou kontrolovány, vykazovat rizikový poměr., Za druhé, stejně jako u všech zde diskutovaných statistik je RR relativním opatřením, které poskytuje informace o riziku v jedné skupině ve srovnání s jinou. Problém je, že studie, kde dvě skupiny rizik, 0,2% a 0,1% nese stejné RR, 2, jako ten, kde dvě skupiny rizik z 90% a 45%. I když v obou případech je to pravda, že zásahy byly na dvojnásobek riziko, to se rovná pouze o 0,1% více, riziko v jednom případě, zatímco 45% větší riziko v jiném případě., Vykazování pouze RR tedy zveličuje účinek v první instanci, zatímco potenciálně dokonce minimalizuje účinek (nebo alespoň dekontextualizuje) ve druhé instanci.
Šance poměry
Zatímco riziko zpráv počet událostí zájmu ve vztahu k celkovému počtu pokusů, pravděpodobnost zpráva počet událostí zájmu ve vztahu k počtu akcí není zájem. Je uvedeno jinak, hlásí počet událostí nonevents., Zatímco rizik, jak je stanoveno dříve, obracející mince, které byly hlavy je 1:2 nebo 50%, pravděpodobnost, obracející mince, které byly hlavy je 1:1, jak tam je jeden požadovaný výsledek (událost) a jeden nežádoucí výsledek (nic nového) (Obrázek 1).
stejně jako u RR, kde poměr dvou rizik byla přijata na dvě samostatné skupiny, v poměru dva kurzy mohou být přijata pro dvě samostatné skupiny vyrábět odds ratio (OR)., Namísto hlášení kolikrát riziko jedna skupina nese ve vztahu k ostatním, zprávy, kolikrát šance, že jedna skupina nese do druhé.
pro většinu je to obtížnější statistika. Riziko je často intuitivnější koncept než kurzy, a tak porozumění relativním rizikům je často upřednostňováno před porozuměním relativním kurzům. Nicméně, nebo netrpí stejnými kauzálními omezeními jako RR, což je široce použitelné.,
například kurzy jsou symetrickým měřítkem, což znamená, že zatímco riziko zkoumá pouze výsledky dané intervence, kurzy mohou také zkoumat intervence dané výsledky. Tak, studie může být konstruována tam, kde, spíše než výběr zkušebních skupin a měření výsledků, výsledky mohou být vybrány, a další faktory mohou být analyzovány. Následuje příklad případové kontrolní studie, situace, kdy RR nelze použít, ale nebo může.
studie případové kontroly z roku 2019 dokazuje dobrý příklad., Snaží se najít potenciální korelace mezi viru hepatitidy A (HAV) infekce prominentní v Kanadě a některých způsobuje faktor, studie byla postavena na základě výsledku (jinými slovy, jednotlivci byly rozděleny do kategorií na základě jejich HAV stav jako „intervence“, nebo příčinné události, byl neznámý). Studie se zaměřila na ty, kteří mají HAV a ty bez a jaké potraviny jedli před infekcí HAV . Z toho bylo vytvořeno několik poměrů kurzů porovnávajících konkrétní potravinovou položku se stavem HAV., Například, data zjištěno, že u těch jedinců, kteří měli expozice krevety/garnáti, osm bylo pozitivních na HAV, zatímco sedm nebyly, zatímco pro ty, bez expozice dva byly pozitivní na HAV, zatímco 29 nebyly. Poměr kursů je převzat (8:7)/(2:29) což se rovná přibližně 16,6. Studie dat hlášeny NEBO 15.75, s malou nesrovnalost pravděpodobné, pocházející z nějaké pre-výpočet úpravy pro matoucích proměnných, které není popsáno v novinách. Byla hlášena hodnota p 0.01, což poskytuje statistické důkazy pro toto nebo významné.,
to lze interpretovat dvěma stejnými způsoby. Za prvé, šance na expozici krevet/krevet pro ty, kteří mají HAV, jsou 15, 75krát vyšší než u těch bez. Ekvivalentně, šance na HAV-posiitve versus HAV-negativní je 15.75 krát vyšší u těch, kteří jsou vystaveni krevetám/krevetám, než u těch, kteří nejsou vystaveni.
celkově nebo poskytuje míru síly spojení mezi dvěma proměnnými na stupnici 1 bez asociace, nad 1 je pozitivní asociace a pod 1 je negativní asociace., Zatímco předchozí dva interpretace jsou správné, nejsou tak přímo srozumitelné, jak by bylo RR, kdyby bylo možné určit jeden. Alternativní interpretace spočívá v tom, že existuje silná pozitivní korelace mezi expozicí krevet/krevet a HAV.
Z tohoto důvodu je v některých konkrétních případech vhodné přiblížit RR s nebo. V takových případech musí předpoklad vzácných onemocnění vydržet. To znamená, že onemocnění musí být v populaci mimořádně vzácné., V tomto případě, riziko onemocnění v populaci (p/(p+q)) přístupy šance onemocnění v populaci (p/q), pokud p se stává nevýznamně malé vzhledem k q. To znamená, že RR a NEBO se sbíhají jako populace dostane větší. Pokud však tento předpoklad selže, rozdíl se stává stále více přehnaným. Matematicky, v p + q studiích, snížení P zvyšuje q, aby se udržely stejné celkové zkoušky. S rizikem se mění pouze čitatel, zatímco s kurzy se čitatel i jmenovatel mění v opačných směrech., V důsledku toho, v případech, kdy RR a nebo jsou oba pod 1, nebo podceňují RR, zatímco v případech, kdy oba jsou nad 1, nebo bude přeceňovat RR.
nesprávné hlášení nebo jako RR pak může často zveličovat data. Je důležité si uvědomit, že nebo je relativní opatření stejně jako RR, a tak někdy velký nebo může odpovídat s malým rozdílem mezi kurzy.
pro nejvěrnější hlášení pak nebo by nemělo být prezentováno jako RR a mělo by být prezentováno pouze jako aproximace RR, pokud předpoklad vzácných onemocnění může rozumně vydržet., Pokud je to možné, měl by být vždy hlášen RR.
poměry nebezpečnosti
jak RR, tak i nebo se týkají intervencí a výsledků, a tak se hlásí po celou dobu studie. Podobné, ale odlišné opatření, poměr rizika (HR), se však týká míry změny (Tabulka 1).
Tabulka 1
RR | NEBO | HOD | |
Cíl | Určit vztah v nebezpečí stav na základě nějaké proměnné. | Určete souvislost mezi dvěma proměnnými. | Určete, jak se jedna skupina mění vzhledem k jiné skupině., |
Použití | nám Říká, jak intervence změny rizika. | nám říká, zda existuje souvislost mezi intervencí a rizikem; odhaduje, jak toto sdružení platí. | nám říká, jak zásah mění rychlost prožívání události. |
Omezení | použije se Pouze v případě designu studie je reprezentativní pro populaci. Nelze použít na případové kontrolní studie., | lze obecně použít všude, ale ne vždy užitečnou statistiku samotnou. Zveličuje rizika. | aby byla obvykle užitečná, měla by být rychlost změny ve dvou skupinách relativně konzistentní. |
časová Osa | Static – nepovažuje sazby. Shrnuje celkovou studii. | Static-nezohledňuje sazby. Shrnuje celkovou studii. | na základě sazeb., Poskytuje informace o tom, jak studie postupuje v průběhu času. |
HRs jsou v tandemu s pozůstalostní křivky, které ukazují časový průběh nějaké události v rámci skupiny, ať už je to událost je smrt, nebo nemoci. V křivce přežití odpovídá svislá osa události zájmu a vodorovná osa odpovídá času. Nebezpečí události je pak ekvivalentní sklonu grafu nebo událostem za čas.
poměr rizika je pouze srovnáním dvou rizik., Může ukázat, jak rychle se dvě křivky přežití liší porovnáním svahů křivek. HR 1 nenaznačuje žádnou divergenci-v obou křivkách byla pravděpodobnost události v daném okamžiku stejně pravděpodobná. HR ne rovno 1 znamená, že dvě události se nevyskytují stejnou rychlostí a riziko jednotlivce v jedné skupině je jiné než riziko jednotlivce v jiném v daném časovém intervalu.
důležitým předpokladem, který HRs činí, je předpoklad proporcionálních sazeb., Pro hlášení jednotného poměru nebezpečnosti je třeba předpokládat, že obě míry nebezpečnosti jsou konstantní. Pokud se má sklon grafu změnit, poměr se v průběhu času také změní, a proto se nebude vztahovat jako srovnání pravděpodobnosti v daném okamžiku.
zvažte pokus o nové chemoterapeutické činidlo usilující o prodloužení délky života pacientů se specifickou rakovinou. Jak v intervenci, tak v kontrolní skupině zemřelo 25% do 40.týdne., Vzhledem k tomu, že obě skupiny se během 40týdenního období snížily ze 100% přežití na 75% přežití, míra nebezpečnosti by byla stejná, a tedy míra nebezpečnosti rovna 1. To naznačuje, že jedinec, který užívá drogu, je stejně pravděpodobné, že zemře, jako ten, který lék nedostává kdykoli.
je však možné, že v intervenční skupině zemřelo všech 25% mezi šesti až 10 týdny, zatímco u kontrolní skupiny zemřelo všech 25% během týdnů jeden až šest. V tomto případě by srovnání medianů zobrazovalo vyšší očekávanou délku života pro ty, kteří jsou na léku, přestože HR nevykazuje žádný rozdíl., V tomto případě předpoklad proporcionálního nebezpečí selže, protože míra nebezpečnosti se v průběhu času mění (poměrně dramaticky). V takových případech není HR použitelná.
Protože je někdy obtížné určit, zda je úměrná nebezpečí předpokladu přiměřeně vztahuje, a protože s HR proužky původního měření (intenzit) na jednotku času, to je běžná praxe hlásit HR ve spolupráci se střední dobou.,
Ve studii hodnotící prognostický výkon Rychlého urgentní Medicína Skóre (REMS) a Worthing Fyziologické Skórovací systém (WPSS), vyšetřovatelé zjistili, že riziko 30-denní mortalita byla zvýšena o 30% za každý další jednotka REMS (HR: 1.28; 95% interval spolehlivosti (CI): 1.23-1.34) a o 60% za každý další WPSS jednotka (HR: 1.6; 95% CI: 1.5-1.7). V tomto případě se úmrtnost nezměnila, ale spíše bodovací systém, který ji předpovídal, takže HR lze použít. S intervalem spolehlivosti mezi 1,5 a 1.,7 pro poměr rizik wpss znamená, že křivka úmrtnosti u osob s vyšším WPS klesá rychleji (asi 1,5-1,7 krát). Vzhledem k tomu, že nízký konec intervalu je stále vyšší než 1, jsme přesvědčeni, že skutečné nebezpečí smrti do 30 dnů je vyšší u skupiny s vyššími WPS .
V roce 2018 studii o pití mezi jedinci s určitými rizikovými faktory, křivky přežití byly konstruovány vykreslování rychlost dosažení nárazového pití pro ovládací prvky, ty se rodinná anamnéza, mužské pohlaví, ty s vysokou impulzivitou, a ty s vyšší reakcí na alkohol., Pro muže a osoby s rodinnou anamnézou, statisticky významné důkazy, pro vyšší míru dosažení nadměrné pití bylo hlásil, (HR 1,74 pro muže a 1.04 pro ty s rodinnou anamnézou) . U osob s vysokou impulzivitou, i když HR byla 1, 17, se interval spolehlivosti 95% pohyboval od 1, 00 do 1, 37. Na 95% úroveň spolehlivosti tedy nelze vyloučit, že HR byla 1,00.,
Protože nadsázky současné době, to je důležité, aby se zabránilo zastupují nejvzdálenější regiony, jako Pmr, a podobně, je důležité si uvědomit, že hlásil, NEBO jen zřídka poskytuje dobrý odhad relativního rizika, ale spíše jen poskytuje určitou míru korelace.
vzhledem ke své schopnosti učinit pevné závěry a srozumitelnost by měl být RR pokud možno hlášen, avšak v případech, kdy je porušen předpoklad kauzality (jako jsou studie případové kontroly a logistická regrese) nebo může být použit.,
HRs se používají s křivkami přežití a předpokládají, že míra nebezpečnosti je v průběhu času stejná. I když je vhodné porovnat dvě sazby, měly by být hlášeny s mediánem, aby se odůvodnil předpoklad proporcionálních rizik.
a Konečně, bez ohledu na hodnoty H/RR/NEBO statistika, interpretace by měla být provedena pouze po stanovení, zda výsledek poskytuje statisticky významné důkazy k závěru (jak je určeno v p-hodnota nebo interval spolehlivosti)., Pamatovat na tyto zásady a rámec HR/RR/NEBO minimalizuje zkreslení a zabraňuje jeden z výkresu nesprávné závěry z výsledků publikované studie týkající se různých vzorků. Obrázek 2 shrnuje správné a nesprávné použití těchto různých rizikových poměrů.
Leave a Reply