Review
Konfidenzintervalle und p-Werte
Um jede Diskussion über statistische Analysen zu unterhalten, ist es wichtig, zuerst das Konzept der Bevölkerungsstatistik zu verstehen. Offensichtlich sind Bevölkerungsstatistiken die Werte jeder Maßnahme innerhalb der interessierenden Bevölkerung, und ihre Schätzung ist das Ziel der meisten Studien ., In einer Studie, in der Adipositas-Raten für Patienten mit einem bestimmten Medikament untersucht wurden, könnte die Bevölkerungsstatistik beispielsweise die durchschnittliche Adipositas-Rate für alle Patienten mit dem Medikament sein.
Die Identifizierung dieses Werts erfordert jedoch Daten für jede einzelne Person, die in diese Kategorie fällt, was unpraktisch ist. Stattdessen kann eine randomisierte Stichprobe gesammelt werden, aus der Stichprobenstatistiken gewonnen werden können. Diese Stichprobenstatistiken dienen als Schätzungen der entsprechenden Bevölkerungsstatistik und ermöglichen es einem Forscher, Rückschlüsse auf eine interessierende Population zu ziehen.,
Eine wesentliche Einschränkung besteht darin, dass diese konstruierten Stichproben repräsentativ für die größere Population von Interesse sein müssen. Während es viele Schritte gibt, die unternommen werden können, um diese Einschränkung zu reduzieren, gehen ihre Auswirkungen (sogenannte Sampling Bias ) manchmal über die Kontrolle des Forschers hinaus. Darüber hinaus könnte die Randomisierung auch in einer theoretischen Situation ohne Stichprobenvorspannung zu einer falschen repräsentativen Stichprobe führen. Nehmen wir im vorherigen Beispiel an, dass die Populationsrate der Adipositas bei allen Erwachsenen, die für das Medikament in Frage kamen, 25% betrug., In einer einfachen Zufallsstichprobe von 30 Patienten aus dieser Population besteht eine Wahrscheinlichkeit von 19, 7%, dass mindestens 10 Patienten fettleibig sind, was zu einer Fettleibigkeitsrate von 33, 3% oder sogar höher führt. Selbst wenn es keinen Zusammenhang zwischen der Medikation und der Adipositas-Rate gibt, ist es immer noch möglich, auf eine Rate zu stoßen, die sich von der Gesamt-Adipositas-Rate zu unterscheiden scheint, die allein durch Zufälligkeit bei der Stichprobe auftrat. Dieser Effekt ist der Grund für die Meldung von Konfidenzintervallen und p-Werten in der klinischen Forschung.
Konfidenzintervalle sind Intervalle, in denen die Bevölkerungsstatistik liegen könnte., Sie werden basierend auf der Stichprobenstatistik und bestimmten Merkmalen der Stichprobe erstellt, die messen, wie wahrscheinlich es ist, repräsentativ zu sein, und bis zu einem bestimmten Schwellenwert gemeldet . Ein 95% – Konfidenzintervall ist ein Intervall, das so konstruiert ist, dass im Durchschnitt 95% der Zufallsstichproben die wahre Populationsstatistik innerhalb ihres 95% – Konfidenzintervalls enthalten würden. Daher wird ein Schwellenwert für signifikante Ergebnisse oft als 95% angenommen, mit dem Verständnis, dass alle Werte innerhalb des gemeldeten Bereichs gleichermaßen gültig sind wie die mögliche Bevölkerungsstatistik.,
Der p-Wert meldet ähnliche Informationen auf andere Weise. Anstatt ein Intervall um eine Stichprobenstatistik herum zu erstellen, meldet ein p-Wert die Wahrscheinlichkeit, dass die Stichprobenstatistik aus einer Zufallsstichprobe einer Population erstellt wurde, angesichts einer Reihe von Annahmen über die Population, die als „Nullhypothese“ bezeichnet werden ., Unter Berücksichtigung der Beispielstudie zu Adipositas-Raten könnte erneut die Adipositas-Rate unter der Stichprobe (eine Stichprobe von Patienten mit dem Medikament) zusammen mit einem p-Wert gemeldet werden, der die Wahrscheinlichkeit bestimmt, dass eine solche Rate aus einer zufälligen Stichprobe der Gesamtbevölkerung von Patienten erzeugt wird, die für das Medikament in Frage kommen. Im Fall der Studie besteht die Nullhypothese darin, dass die Populationsrate der Fettleibigkeit bei Patienten mit dem Medikament der Gesamtrate der Fettleibigkeit bei allen Patienten entspricht, die für das Medikament in Frage kommen, dh 25%., Ein einschwänziger p-Wert kann verwendet werden, wenn Grund zu der Annahme besteht, dass ein Effekt nur in eine Richtung auftreten würde (zum Beispiel kann es Grund zu der Annahme geben, dass das Medikament die Gewichtszunahme erhöhen, aber nicht verringern würde), während ein zweischwänziger p-Wert in allen anderen Fällen verwendet werden sollte. Bei Verwendung einer symmetrischen Verteilung, wie der Normalverteilung, sind zweischwänzige p-Werte einfach doppelt so hoch wie der einschwänzige p-Wert.
Nehmen wir noch einmal an, dass eine Stichprobe von 30 Patienten mit dem Medikament 12 übergewichtige Personen enthält. Bei einem One-Tailed-Test beträgt unser p-Wert 0,0216 (unter Verwendung der Binomialverteilung)., Somit können wir sagen, dass sich unsere beobachtete Rate von 40% signifikant von der hypothetischen Rate von 25% bei einem Signifikanzniveau von 0,05 unterscheidet. In einem anderen Sinne beträgt das 95% – Konfidenzintervall für den beobachteten Anteil 25,6% bis 61,07%. Konfidenzintervalle entsprechen Zwei-Tailed-Tests, bei denen ein Zwei-Tailed-Test nur dann abgelehnt wird, wenn das Konfidenzintervall nicht den Wert enthält, der der Nullhypothese zugeordnet ist (in diesem Fall 25%).
Wenn ein berechneter p-Wert klein ist, ist es wahrscheinlich, dass die Population nicht wie ursprünglich in der Nullhypothese angegeben strukturiert ist., Wenn wir einen niedrigen p-Wert erhalten, haben wir Hinweise darauf, dass es einen Effekt oder Grund für den beobachteten Unterschied gab – das Medikament in diesem Fall. Typischerweise wird ein Schwellenwert von 0,05 (oder 5%) verwendet, wobei ein p-Wert unter diesem Schwellenwert liegen muss, damit sein entsprechendes Attribut statistisch signifikant ist.
Risikoquoten
Risiko, ein weiterer Begriff für Wahrscheinlichkeit, ist ein weiteres Grundprinzip der statistischen Analyse. Wahrscheinlichkeit ist ein Vergleich der Beobachtung eines bestimmten Ereignisses, das als Ergebnis auftritt, mit den gesamten eindeutigen Ergebnissen., Ein Münzwurf ist ein triviales Beispiel: Das Risiko, einen Kopf zu beobachten, beträgt ½ oder 50%, da von allen möglichen einzigartigen Versuchen (ein Flip, der zu Köpfen führt, oder ein Flip, der zu Schwänzen führt) nur einer das Ereignis von Interesse ist (Köpfe).
Wenn Sie nur Risiko verwenden, können Sie Vorhersagen über eine einzelne Population treffen. Mit Blick auf die Adipositas-Raten innerhalb der US-Bevölkerung berichtete die CDC beispielsweise, dass 42.4% der Erwachsenen in 2017-2018 fettleibig waren. Das Risiko, dass eine Person in den USA fettleibig ist, liegt also bei 42, 4% . Die meisten Studien untersuchen jedoch die Wirkung eines bestimmten Eingriffs oder eines anderen Gegenstands (z. B. Mortalität) auf einen anderen., Früher haben wir angenommen, dass die Adipositas-Rate der berechtigten Patienten 25% betrug, aber hier werden wir die 42,4% verwenden, die mit der erwachsenen US-Bevölkerung verbunden sind. Angenommen, wir beobachten ein Risiko von 25% bei einer Zufallsstichprobe von Patienten mit dem Medikament. Um die Wirkung des Medikaments auf Fettleibigkeit zu konzeptualisieren, wäre ein logischer nächster Schritt, das Risiko von Fettleibigkeit in der US-Bevölkerung auf das Medikament mit dem Risiko von Fettleibigkeit in der US-Bevölkerung zu teilen, was zu einem Risikoverhältnis von 0.590 führt.,
Mit dieser Berechnung – einem Verhältnis zweier Risiken – ist die gleichnamige Risikoquote (RR) – Statistik gemeint, die auch als relatives Risiko bezeichnet wird. Es kann eine bestimmte Anzahl angegeben werden, für wie viel mehr Risiko eine Person in einer Kategorie im Vergleich zu einer Person in einer anderen Kategorie trägt. Im Beispiel trägt eine Person, die das Medikament einnimmt, 0,59 mal so viel Risiko wie ein Erwachsener aus der allgemeinen US-Bevölkerung., Wir haben jedoch angenommen, dass die Bevölkerung, die für das Medikament in Frage kommt, eine Adipositas – Rate von 25% hatte-vielleicht ist nur eine Gruppe junger Erwachsener, die im Durchschnitt gesünder sind, berechtigt, das Medikament einzunehmen. Bei der Untersuchung der Wirkung des Medikaments auf Fettleibigkeit ist dies der Anteil, der als Nullhypothese verwendet werden sollte. Wenn wir eine Adipositas-Rate auf dem Medikament von 40% beobachten, mit einem p-Wert unter dem Signifikanzniveau von 0,05, ist dies ein Beweis dafür, dass das Medikament das Risiko von Fettleibigkeit erhöht (mit einem RR, in diesem Szenario von 1,6)., Daher ist es wichtig, die Nullhypothese sorgfältig auszuwählen, um relevante statistische Vorhersagen zu treffen.
Bei RR bedeutet ein Ergebnis von 1, dass beide Gruppen das gleiche Risiko haben, während Ergebnisse, die nicht gleich 1 sind, darauf hinweisen, dass eine Gruppe ein höheres Risiko birgt als eine andere, ein Risiko, von dem angenommen wird, dass es auf die von der Studie untersuchte Intervention zurückzuführen ist (formal die Annahme einer kausalen Richtung).
Zur Veranschaulichung betrachten wir die Ergebnisse einer Studie aus dem Jahr 2009, die im Journal of Stroke and Cerebrovascular Diseases veröffentlicht wurde., Die Studie berichtet, dass Patienten mit einem verlängerten elektrokardiographischen QTc-Intervall innerhalb von 90 Tagen häufiger starben als Patienten ohne verlängertes Intervall (relatives Risiko =2,5; 95% Konfidenzintervall 1,5-4,1) . Ein Konfidenzintervall zwischen 1,5 und 4,1 für das Risikoverhältnis zeigt an, dass Patienten mit einem verlängerten QTc-Intervall in 90 Tagen 1,5-4,1-mal häufiger starben als Patienten ohne ein verlängertes QTc-Intervall.,
Ein zweites Beispiel – in einem wegweisenden Papier , das zeigt, dass die Blutdruckkurve bei akutem ischämischem Schlaganfall eher U-förmig als J-förmig ist, stellten die Forscher fest, dass die RR bei Patienten mit mittlerem arteriellen Blutdruck (MAP) fast doppelt so hoch war >140 mmHg oder <100 mmHg (RR=1.8, 95% CI 1.1-2.9, p=0.027). Ein CI von 1,1-2,9 für die RR bedeutet, dass Patienten mit einer KARTE außerhalb des Bereichs von 100-140 mmHg 1,1-2,9 mal häufiger starben als diejenigen, die eine erste KARTE innerhalb dieses Bereichs hatten.,
Ein weiteres Beispiel ist eine Studie von 2018 über australische Marine-Rekruten ergab, dass diejenigen mit vorgefertigten Orthesen (eine Art Fußstütze) ein 20,3% iges Risiko hatten, mindestens eine nachteilige Wirkung zu erleiden, während diejenigen ohne ein Risiko von 12,4% hatten . Ein Risikoverhältnis wird hier durch 0,203/0,124 oder 1,63 angegeben, was darauf hindeutet, dass Rekruten mit Fußorthesen das 1,63-fache des Risikos tragen, unerwünschte Folgen zu haben (z. B. Fußblasen, Schmerzen usw.).) als die ohne. Dieselbe Studie berichtet jedoch über ein 95% iges Konfidenzintervall für das Risikoverhältnis von 0, 96 bis 2, 76 mit einem p-Wert von 0, 068., Betrachtet man das Konfidenzintervall, umfasst der 95% – Bereich (der allgemein akzeptierte Standard) Werte unter 1, 1 und Werte über 1. Wenn man sich daran erinnert, dass alle Werte mit 95% iger Wahrscheinlichkeit die Bevölkerungsstatistik sind, kann man nicht ausschließen, dass Fußorthesen keine Wirkung haben, einen signifikanten Nutzen haben oder einen signifikanten Nachteil haben. Darüber hinaus ist der p-Wert größer als der Standard von 0,05, daher liefern diese Daten keine signifikanten Hinweise darauf, dass Fußorthesen eine konsistente Wirkung auf unerwünschte Ereignisse wie Blasen und Schmerzen haben., Wie bereits erwähnt, ist dies kein Zufall – wenn sie mit denselben oder ähnlichen Methoden berechnet werden und der p-Wert zweischneidig ist, melden Konfidenzintervalle und p-Werte dieselben Ergebnisse.
Bei korrekter Verwendung sind Risikoquoten eine aussagekräftige Statistik, die es ermöglicht, in einer Population die Veränderung des Risikos abzuschätzen, das eine Population gegenüber einer anderen trägt., Sie sind ziemlich leicht zu verstehen (der Wert ist, wie oft das Risiko einer Gruppe gegenüber einer anderen trägt) und zeigen unter der Annahme der kausalen Richtung schnell, ob eine Intervention (oder eine andere getestete Variable) Auswirkungen auf die Ergebnisse hat.
Allerdings gibt es Einschränkungen. Erstens kann RRs nicht in allen Fällen angewendet werden. Da das Risiko in einer Stichprobe eine Schätzung des Risikos in einer Population ist, muss die Stichprobe angemessen repräsentativ für die Population sein. Daher können Fall-Kontroll-Studien aufgrund der Tatsache, dass die Verhältnisse der Ergebnisse kontrolliert werden, kein Risikoverhältnis gemeldet werden., Zweitens ist RR, wie bei allen hierin diskutierten Statistiken, ein relatives Maß, das Informationen über das Risiko in einer Gruppe relativ zu einer anderen liefert. Das Problem hierbei ist, dass eine Studie, in der zwei Gruppen ein Risiko von 0, 2% und 0, 1% hatten, das gleiche RR (2) aufweist wie eine, in der zwei Gruppen ein Risiko von 90% und 45% hatten. Obwohl in beiden Fällen das Risiko doppelt so hoch war, entspricht dies in einem Fall nur 0,1% mehr Risiko, in einem anderen Fall 45% mehr Risiko., Wenn Sie also nur die RR melden, wird der Effekt in erster Instanz übertrieben, während der Effekt in der zweiten Instanz möglicherweise sogar minimiert (oder zumindest dekontextualisiert) wird.
Odds ratios
Während risk die Anzahl der Ereignisse von Interesse in Bezug auf die Gesamtzahl der Versuche meldet, melden Odds die Anzahl der Ereignisse von Interesse in Bezug auf die Anzahl der Ereignisse, die nicht von Interesse sind. Anders ausgedrückt, meldet es die Anzahl der Ereignisse an Nonevents., Während das Risiko, wie zuvor bestimmt, eine Münze zu drehen, um Köpfe zu sein, 1:2 oder 50% beträgt, beträgt die Wahrscheinlichkeit, eine Münze zu drehen, um Köpfe zu sein, 1:1, da es ein gewünschtes Ergebnis (Ereignis) und ein unerwünschtes Ergebnis gibt (nicht Ereignis) (Abbildung 1).
Genau wie bei RR, wo das Verhältnis von zwei Risiken für zwei separate Gruppen genommen wurde, kann ein Verhältnis von zwei Chancen für zwei separate Gruppen genommen werden, um ein Odds Ratio (ODER) zu erzeugen., Anstatt zu berichten, wie oft das Risiko einer Gruppe relativ zur anderen trägt, wird berichtet, wie oft die Chancen einer Gruppe gegenüber der anderen sind.
Für die meisten ist dies eine schwieriger zu verstehende Statistik. Risiko ist oft ein intuitiveres Konzept als Chancen, und daher wird das Verständnis relativer Risiken oft dem Verständnis relativer Chancen vorgezogen. ODER leidet jedoch nicht unter den gleichen Kausalannahmeeinschränkungen wie RR, wodurch es breiter anwendbar ist.,
Zum Beispiel sind Odds ein symmetrisches Maß, was bedeutet, dass während risk nur Ergebnisse bei Interventionen untersucht, Odds auch Interventionen bei gegebenen Ergebnissen untersuchen kann. Auf diese Weise kann eine Studie erstellt werden, in der anstelle der Auswahl von Versuchsgruppen und der Messung der Ergebnisse Ergebnisse ausgewählt und andere Faktoren analysiert werden können. Das Folgende ist ein Beispiel für eine Fall-Kontroll-Studie, eine Situation, in der RR nicht verwendet werden kann, aber ODER kann.
Eine Fall-Kontroll-Studie aus dem Jahr 2019 zeigt ein gutes Beispiel., Auf der Suche nach einer möglichen Korrelation zwischen einer in Kanada bekannten Hepatitis-A-Virus-Infektion (HAV) und einem verursachenden Faktor wurde eine Studie basierend auf dem Ergebnis erstellt (mit anderen Worten, Personen wurden basierend auf ihrem HAV-Status kategorisiert, da die „Intervention“ oder das kausale Ereignis unbekannt war). Die Studie untersuchte diejenigen mit HAV und diejenigen ohne und welche Lebensmittel sie vor der HAV-Infektion gegessen hatten . Von diesem, mehrere odds ratios wurden gebaut Vergleich ein bestimmtes Nahrungsmittel HAV-status., Zum Beispiel fanden die Daten heraus, dass unter den Probanden, die Garnelen/Garnelen ausgesetzt waren, acht positiv für HAV waren, während sieben nicht, während für diejenigen ohne Exposition zwei positiv für HAV waren, während 29 nicht waren. Ein Odds Ratio wird genommen von (8:7)/(2:29) das entspricht ungefähr 16,6. Die Daten in der Studie berichtete von einer ODER von 15.75, mit der kleinen Abweichung wahrscheinlich, die aus einem pre-Berechnung der Anpassung für verwirrende Variablen, die nicht diskutiert wurde in dem Papier. Ein p-Wert von 0,01 berichtet wurde, wodurch statistische Beweise für diese ODER wesentliche.,
Dies kann auf zwei gleiche Arten interpretiert werden. Erstens sind die Chancen der Garnelen/Garnelen-Exposition für diejenigen mit HAV 15,75 mal höher als für diejenigen ohne. Gleichwertig, Die Chancen für HAV-Posiitve versus HAV-Negativ ist 15.75 mal höher für diejenigen, die Garnelen/Garnelen ausgesetzt sind als für diejenigen, die nicht ausgesetzt sind.
Insgesamt ODER liefert ein Maß für die Stärke der Assoziation zwischen zwei Variablen auf einer Skala von 1 ohne Assoziation, über 1 als positive Assoziation und unter 1 als negative Assoziation., Während die beiden vorherigen Interpretationen korrekt sind, sind sie nicht so direkt verständlich, wie es ein RR gewesen wäre, wenn es möglich gewesen wäre, eine zu bestimmen. Eine alternative Interpretation ist, dass es eine starke positive Korrelation zwischen Garnelen/Garnelen-Exposition und HAV gibt.
Aus diesem Grund ist es in bestimmten Fällen angebracht, RR mit ODER zu approximieren. In solchen Fällen muss die Annahme der seltenen Krankheit gelten. Das heißt, eine Krankheit muss in einer Bevölkerung äußerst selten sein., In diesem Fall nähert sich das Risiko der Krankheit innerhalb der Population (p/(p+q)) den Chancen der Krankheit innerhalb der Population (p/q), da p im Vergleich zu q unbedeutend klein wird. Wenn diese Annahme jedoch fehlschlägt, wird der Unterschied zunehmend übertrieben. Mathematisch erhöht sich in p+q-Studien durch abnehmendes p + q, um die gleichen Gesamtversuche aufrechtzuerhalten. Mit Risiko ändert sich nur der Zähler, während sich bei Chancen sowohl der Zähler als auch der Nenner in entgegengesetzte Richtungen ändern., Infolgedessen wird das OR für Fälle, in denen RR und OR beide unter 1 liegen, das RR unterschätzen, während für Fälle, in denen beide über 1 liegen, das OR das RR überschätzen wird.
Eine falsche Meldung des OR als RR kann dann oft Daten übertreiben. Es ist wichtig, sich daran zu erinnern, dass OR ein relatives Maß genauso RR ist und daher manchmal ein großes ODER mit einem kleinen Unterschied zwischen den Quoten korrespondieren kann.
Für die treueste Berichterstattung, dann ODER sollte nicht als RR dargestellt werden, und sollte nur als eine Annäherung an RR präsentiert werden, wenn die seltene Krankheit Annahme vernünftigerweise halten kann., Wenn möglich, sollte immer ein RR gemeldet werden.
Gefahrenverhältnisse
Sowohl RR als auch OR betreffen Interventionen und Ergebnisse und berichten somit über einen gesamten Untersuchungszeitraum. Eine ähnliche, aber unterschiedliche Kennzahl, die Hazard Ratio (HR), betrifft jedoch Veränderungsraten (Tabelle 1).
Tabelle 1
RR | ODER | HR | |
Goal | Bestimmen Sie die Beziehung im Risikostatus basierend auf einer Variablen. | Bestimmen Sie die Zuordnung zwischen zwei Variablen. | Bestimmen Sie, wie sich eine Gruppe relativ zu einer anderen ändert., | Use | Teilt uns mit, wie eine Intervention die Risiken verändert. | Teilt uns mit, ob ein Zusammenhang zwischen einer Intervention und einem Risiko besteht; schätzt, wie diese Assoziation zutrifft. | Teilt uns mit, wie eine Intervention die Erlebnisrate eines Ereignisses ändert. |
Einschränkungen | Nur anwendbar, wenn das Studiendesign repräsentativ für die Population ist. Kann nicht für Fall-Kontroll-Studien verwendet werden., | Kann im Allgemeinen überall angewendet werden, aber nicht immer eine nützliche Statistik selbst. Übertreibt Risiken. | Um normalerweise nützlich zu sein, sollte die Änderungsrate innerhalb von zwei Gruppen relativ konsistent sein. | Timeline | Static – berücksichtigt keine Raten. Fasst eine Gesamtstudie zusammen. | Statisch nicht berücksichtigt Preisen. Fasst eine Gesamtstudie zusammen. | Basiert auf Preisen., Bietet Informationen darüber, wie eine Studie im Laufe der Zeit fortschreitet. |
HRs stehen im Tandem mit Überlebenskurven, die das zeitliche Fortschreiten eines Ereignisses innerhalb einer Gruppe anzeigen, unabhängig davon, ob dieses Ereignis der Tod ist oder eine Krankheit ist. In einer Überlebenskurve entspricht die vertikale Achse dem interessierenden Ereignis und die horizontale Achse der Zeit. Die Gefahr des Ereignisses entspricht dann der Steigung des Diagramms oder den Ereignissen pro Zeit.
Ein Gefahrenverhältnis ist einfach ein Vergleich zweier Gefahren., Es kann zeigen, wie schnell zwei Überlebenskurven durch den Vergleich der Steigungen der Kurven divergieren. Ein HR von 1 zeigt keine Divergenz an – innerhalb beider Kurven war die Wahrscheinlichkeit des Ereignisses zu einem bestimmten Zeitpunkt gleich wahrscheinlich. Eine HR nicht gleich 1 zeigt an, dass zwei Ereignisse nicht mit der gleichen Rate auftreten und das Risiko einer Person in einer Gruppe in einem bestimmten Zeitintervall anders ist als das Risiko einer Person in einer anderen.
Eine wichtige Annahme, die wir machen, ist die proportionale Rate Annahme., Um ein singuläres Gefahrenverhältnis zu melden, muss davon ausgegangen werden, dass die beiden Gefahrenraten konstant sind. Wenn sich die Steigung des Graphen ändern soll, ändert sich das Verhältnis ebenfalls im Laufe der Zeit und gilt daher zu keinem bestimmten Zeitpunkt als Vergleich der Wahrscheinlichkeit.
Betrachten Sie die Studie mit einem neuartigen Chemotherapeutikum, das die Lebenserwartung von Patienten mit einem bestimmten Krebs verlängern soll. Sowohl in der Intervention als auch in der Kontrollgruppe waren 25% in Woche 40 gestorben., Da beide Gruppen im Zeitraum von 40 Wochen von 100% Überleben auf 75% Überleben abnahmen, wären die Gefährdungsraten gleich und damit die Gefährdungsrate gleich 1. Dies deutet darauf hin, dass eine Person, die das Medikament erhält, genauso wahrscheinlich stirbt wie eine Person, die das Medikament zu keinem Zeitpunkt erhält.
Es ist jedoch möglich, dass in der Interventionsgruppe alle 25% zwischen den Wochen sechs bis 10 starben, während in der Kontrollgruppe alle 25% innerhalb der Wochen eins bis sechs starben. In diesem Fall würde der Vergleich der Mediane eine höhere Lebenserwartung für diejenigen zeigen, die das Medikament einnehmen, obwohl die HR keinen Unterschied zeigt., In diesem Fall schlägt die proportionale Gefahrenannahme fehl, da sich die Gefahrenraten im Laufe der Zeit (ziemlich dramatisch) ändern. In solchen Fällen ist HR nicht anwendbar.
Da es manchmal schwierig ist, festzustellen, ob die proportionale Gefahrenannahme vernünftigerweise zutrifft, und weil eine HR die ursprüngliche Messung (Gefahrenraten) der Zeiteinheit entfernt, ist es gängige Praxis, HR in Verbindung mit Medianzeiten zu melden.,
In einer Studie zur Bewertung der prognostischen Leistung des Rapid Emergency Medicine Score (REMS) und des Worthing Physiological Scoring System (WPSS) stellten die Forscher fest, dass das Risiko einer 30-tägigen Mortalität für jede weitere REMS-Einheit um 30% erhöht wurde (HR: 1.28; 95% Konfidenzintervall (CI): 1.23-1.34) und um 60% für jede zusätzliche WPSS-Einheit (HR: 1.6; 95% KI: 1.5-1.7). In diesem Fall hat sich die Sterblichkeitsrate nicht geändert, sondern das Bewertungssystem, um es vorherzusagen, so dass die HR verwendet werden kann. Mit einem Konfidenzintervall zwischen 1,5 und 1.,7 für das WPSS Hazards Ratio gibt an, dass die Mortalitätskurve für Personen mit einem höheren RISIKO schneller abnimmt (etwa das 1,5-bis 1,7-fache). Da das untere Ende des Intervalls immer noch über 1 liegt, sind wir zuversichtlich, dass die wahre Todesgefahr innerhalb von 30 Tagen für die Gruppe mit höherer WAHRSCHEINLICHKEIT höher ist .
In einer Studie von 2018 über Alkoholexzesse bei Personen mit bestimmten Risikofaktoren wurde eine Überlebenskurve erstellt, die die Rate des Erreichens von Alkoholexzessen für Personen, Personen mit Familienanamnese, männlichem Geschlecht, Personen mit hoher Impulsivität und Personen mit einer höheren Reaktion auf Alkohol aufzeichnet., Für Männer und Personen mit Familienanamnese wurden statistisch signifikante Beweise für eine höhere Rate von Alkoholexzessen berichtet (eine HR von 1, 74 für Männer und 1, 04 für Personen mit Familienanamnese) . Für diejenigen mit hoher Impulsivität lag das 95% – Konfidenzintervall jedoch zwischen 1,00 und 1,37, obwohl die HR 1,17 betrug. Somit ist es bis zu einem 95% igen Konfidenzniveau unmöglich auszuschließen, dass die HR 1,00 war.,
Aufgrund der vorhandenen Übertreibung ist es wichtig, die Darstellung von ORs als RRs zu vermeiden, und in ähnlicher Weise ist es wichtig zu erkennen, dass ein gemeldetes ORs selten eine gute Annäherung an relative Risiken bietet, sondern lediglich ein Maß für die Korrelation liefert.
Aufgrund seiner Fähigkeit, feste Schlussfolgerungen und Verständlichkeit zu ziehen, sollte RR nach Möglichkeit gemeldet werden, jedoch in den Fällen, in denen seine Kausalitätsannahme verletzt wird (z. B. Fall-Kontroll-Studien und logistische Regression) ODER verwendet werden kann.,
Stunden werden mit Überlebenskurven verwendet und gehen davon aus, dass die Gefahrenraten im Laufe der Zeit gleich sind. Obwohl nützlich, um zwei Raten zu vergleichen, sollten sie mit Medianzeiten gemeldet werden, um die proportionale Risikoannahme zu rechtfertigen.
Schließlich sollte unabhängig vom Wert der HR/RR/ODER Statistik eine Interpretation nur vorgenommen werden, nachdem festgestellt wurde, ob das Ergebnis statistisch signifikante Beweise für eine Schlussfolgerung liefert (wie durch den p-Wert oder das Konfidenzintervall bestimmt)., Die Erinnerung an diese Prinzipien und den Rahmen von HR/RR/OR minimiert falsche Darstellungen und verhindert, dass aus den Ergebnissen einer veröffentlichten Studie zu verschiedenen Stichproben falsche Schlussfolgerungen gezogen werden. Abbildung 2 fasst die korrekte und falsche Verwendung dieser verschiedenen Risikokennzahlen zusammen.
Leave a Reply