revisão
intervalos de confiança e valores p
a fim de entreter qualquer discussão de análise estatística, é importante primeiro compreender o conceito de estatísticas da população. Claramente, as estatísticas demográficas são os valores de qualquer medida dentro da população de interesse, e estimá-los é o objetivo da maioria dos estudos ., Por exemplo, num estudo que analisa as taxas de obesidade dos doentes medicados, a estatística populacional pode ser a taxa média de obesidade de todos os doentes medicados.
no entanto, identificar este valor exigiria ter dados para cada indivíduo que se insere nesta categoria, o que é impraticável. Em vez disso, uma amostra aleatória pode ser recolhida, a partir da qual as Estatísticas da amostra podem ser obtidas. Estas estatísticas de amostra servem como estimativas das estatísticas da população correspondentes e permitem que um pesquisador faça conclusões sobre uma população de interesse.,existe uma limitação significativa na medida em que estas amostras construídas devem ser representativas da maior população de interesse. Embora haja muitos passos que podem ser dados para reduzir esta limitação, às vezes seus efeitos (chamado viés de amostragem ) vão além do controle do pesquisador. Além disso, mesmo em uma situação teórica sem viés de amostragem, a aleatorização poderia resultar em uma amostra deturpada. No exemplo anterior, suponha que a taxa de obesidade da população entre todos os adultos elegíveis para a medicação era de 25%., Em uma simples amostra aleatória de 30 pacientes desta população, há 19,7% de chance de que pelo menos 10 pacientes sejam obesos, resultando em uma taxa de obesidade de amostra de 33,3% ou até mais. Mesmo que não haja relação entre a medicação e as taxas de obesidade, ainda é possível encontrar uma taxa que parece ser diferente da taxa global de obesidade, que ocorreu através da aleatoriedade apenas na amostragem. Este efeito é a razão para comunicar os intervalos de confiança e os valores-p na investigação clínica.os intervalos de confiança são intervalos nos quais a estatística da população pode situar-se., São construídas com base nas estatísticas da amostra e em determinadas características da amostra que avaliam a probabilidade de ser representativa e são comunicadas a um determinado limiar . Um intervalo de confiança de 95% é um intervalo construído de tal forma que, em média, 95% das amostras aleatórias conteriam a estatística da população verdadeira dentro do seu intervalo de confiança de 95%. Assim, um limiar para resultados significativos é muitas vezes considerado como 95%, com o entendimento de que todos os valores dentro do intervalo relatado são igualmente válidos como a estatística da população possível.,
o valor de p reporta informação semelhante de uma forma diferente. Ao invés de construir um intervalo em torno de uma estatística de amostra, um valor-p relata a probabilidade de que a estatística de amostra foi produzida a partir de amostragem aleatória de uma população, dado um conjunto de suposições sobre a população, referido como a “hipótese nula” ., Tomando o exemplo do estudo sobre as taxas de obesidade novamente, a taxa de obesidade entre a amostra (uma amostra de pacientes com o medicamento) poderia ser relatada juntamente com um valor p determinando a chance de que tal taxa poderia ser produzida a partir de amostragem aleatória da população total de pacientes elegíveis para o medicamento. No caso do estudo, a hipótese nula é que a taxa populacional de obesidade entre os pacientes medicados é igual à taxa global de obesidade entre todos os pacientes elegíveis para a medicação, ou seja, 25%., Um uni-caudal p-valor pode ser usado se houver razão para crer que o efeito poderia ocorrer em apenas uma direção (por exemplo, pode haver razão para acreditar que a medicação poderia aumentar o ganho de peso, mas não diminuí-lo), enquanto que um bicaudal valor de p deve ser usado em todos os outros casos. Quando se utiliza uma distribuição simétrica, como a distribuição normal, os valores de P de duas caudas são simplesmente o dobro do valor de P de uma caída.suponha novamente que uma amostra de 30 doentes a tomar o medicamento contém 12 indivíduos obesos. Com um teste de cauda única, o nosso valor p é 0,0216 (usando a distribuição binomial)., Assim, podemos dizer que a nossa taxa observada de 40% é significativamente diferente da taxa hipotética de 25% a um nível de significância de 0,05. Em outro sentido, o intervalo de confiança de 95% para a proporção observada é de 25, 6% a 61, 07%. Os intervalos de confiança correspondem a ensaios de duas caudas, em que um ensaio de duas caudas é rejeitado se e apenas se o intervalo de confiança não contiver o valor associado à hipótese nula (neste caso, 25%).
Se um valor p calculado é pequeno, é provável que a população não esteja estruturada como originalmente indicado na hipótese nula., Se obtivermos um valor p baixo, temos provas de que houve algum efeito ou razão para a diferença observada – a medicação, neste caso. Um limiar de 0,05 (ou 5%) é tipicamente usado, com um valor p tendo que ser abaixo deste limiar para que seu atributo correspondente seja estatisticamente significativo.
rácios de risco
risco, outro termo para Probabilidade, é outro princípio fundamental da análise estatística. Probabilidade é uma comparação de observar um evento específico que ocorre como resultado dos resultados únicos totais., Uma moeda flip é um exemplo trivial: o risco de observar uma cabeça é de ½ ou 50%, como de todos os possíveis ensaios únicos (um flip resultando em Cara ou um flip resultando em Coroa), apenas um é o evento de interesse (cara).
usando apenas o risco permite previsões sobre uma única população. Por exemplo, olhando para as taxas de obesidade dentro da população dos EUA, o CDC relatou que 42,4% dos adultos eram obesos em 2017-2018. Assim, o risco de um indivíduo nos EUA ser obeso é de cerca de 42,4%. No entanto, a maioria dos estudos olha para o efeito de uma intervenção específica ou outro item (como a mortalidade) em outro., Anteriormente, supúnhamos que a taxa de obesidade dos pacientes elegíveis era de 25%, mas aqui vamos usar os 42,4% associados com a população adulta dos EUA. Suponha que observemos um risco de 25% em uma amostra aleatória de pacientes com a medicação também. Para conceituar o efeito da medicação sobre a obesidade, o próximo passo lógico seria dividir o risco de obesidade na população dos EUA sobre a medicação com o risco de obesidade na população dos EUA, o que resulta em uma taxa de risco de 0.590.,
este cálculo-um rácio de dois riscos – é o que se entende por Estatística do rácio de risco homónimo (RR), também conhecido por risco relativo. Permite indicar um número específico para o risco que um indivíduo de uma categoria suporta em comparação com um indivíduo de outra categoria. No exemplo, um indivíduo que toma a medicação tem 0,59 vezes mais risco que um adulto da população geral dos EUA., No entanto, assumimos que a população elegível para a medicação tinha uma taxa de obesidade de 25% – talvez apenas um grupo de jovens adultos, que podem ser mais saudáveis em média, são elegíveis para tomar a medicação. Ao investigar o efeito da medicação sobre a obesidade, esta é a proporção que deve ser usada como hipótese nula. Se observarmos uma taxa de obesidade na medicação de 40%, com um valor p menor que o nível de significância de 0,05, isso é evidência de que a medicação aumenta o risco de obesidade (com um RR, neste cenário, de 1,6)., Como tal, é importante escolher cuidadosamente a hipótese nula para fazer previsões estatísticas relevantes.
Com RR resultado de 1 significa que ambos os grupos têm a mesma quantidade de risco, embora os resultados não são iguais a 1 indicam que um grupo de furo mais risco do que o outro, um risco, que é assumido ser devido à intervenção analisada pelo estudo (formalmente, a assunção da direção causal).para ilustrar, olhamos para os resultados de um estudo de 2009 publicado no Journal of Stroke and Cerebrovascular Diseases., O estudo relata que os doentes com um intervalo QTc electrocardiográfico prolongado tiveram maior probabilidade de morrer em 90 dias comparativamente aos doentes sem intervalo prolongado (risco relativo =2, 5; intervalo de confiança de 95% 1, 5-4, 1) . Ter um intervalo de confiança entre 1,5 e 4.1 para a taxa de risco indica que os pacientes com um prolongado intervalo QTc (1,5-4.1 vezes mais probabilidade de morrer em 90 dias do que aqueles sem um prolongado intervalo QTc.,
Um segundo exemplo, em um marco de papel, demonstrando que a curva da pressão arterial na fase aguda de acidente vascular cerebral isquêmico é em forma de U, ao invés de incluir J-shaped , os investigadores descobriram que o RR aumentou quase duas vezes maior em pacientes com média de pressão arterial (MAPA) >140 mmHg ou <100 mmHg (RR=1.8, 95% CI 1.1-2.9, p=0,027). Ter um IC de 1, 1-2, 9 para a RR significa que os pacientes com um mapa fora da faixa de 100-140 mmHg foram 1, 1-2, 9 vezes mais propensos a morrer do que aqueles que tinham um mapa inicial dentro desta faixa.,
Por outro exemplo, um estudo de 2018 sobre recrutas navais australianos descobriu que aqueles com ortoses pré-fabricadas (um tipo de Apoio ao pé) tinham um risco de 20,3% de sofrer pelo menos um efeito adverso, enquanto os que não tinham um risco de 12,4% . Uma taxa de risco aqui é dada por 0.203/0.124, ou 1.63, sugerindo que os recrutas com pé órteses furo 1.63 vezes o risco de ter algumas conseqüências adversas (por exemplo, pé de bolha, dor, etc.) do que aqueles sem. No entanto, o mesmo estudo relata um intervalo de confiança de 95% para o rácio de risco de 0, 96 a 2, 76, com um valor-p de 0, 068., Olhando para o intervalo de confiança, o intervalo relatado de 95% (o padrão comumente aceito) inclui valores abaixo de 1, 1, e valores acima de 1. Lembrando que todos os valores são igualmente susceptíveis de ser as Estatísticas da população, com 95% de confiança, não há como excluir a possibilidade de que ortoses do pé não têm efeito, têm um benefício significativo, ou têm um prejuízo significativo. Além disso, o valor p é maior do que o padrão de 0, 05, portanto, estes dados não fornecem evidência significativa de ortoses do pé que tenham qualquer efeito consistente em eventos adversos, tais como bolhas e dor., Tal como referido anteriormente, não se trata de uma coincidência – se forem calculados utilizando os mesmos métodos ou métodos similares e o valor-p for de duas caudas, os intervalos de confiança e os valores-p irão comunicar os mesmos resultados.
Quando utilizado corretamente, as razões de risco são uma estatística poderosa que permite uma estimativa em uma população da mudança no risco que uma população suporta sobre outra., Eles são bastante fáceis de entender (o valor é quantas vezes o risco que um grupo suporta sobre outro), e com a suposição de direção causal, mostram rapidamente se uma intervenção (ou outra variável testada) tem um efeito sobre os resultados.no entanto, existem limitações. Em primeiro lugar, o RRs não pode ser aplicado em todos os casos. Uma vez que o risco numa amostra é uma estimativa do risco numa população, a amostra deve ser razoavelmente representativa da população. Como tal, os estudos de caso-controlo, em virtude simples do facto de os rácios de resultados serem controlados, não podem ter um rácio de risco notificado., Em segundo lugar, tal como acontece com todas as estatísticas aqui discutidas, a RR é uma medida relativa, fornecendo informação sobre o risco num grupo em relação a outro. O problema aqui é que um estudo em que dois grupos tinham um risco de 0,2% e 0,1% tem o mesmo RR, 2, como um em que dois grupos tinham um risco de 90% e 45%. Embora em ambos os casos seja verdade que aqueles com a intervenção estavam com o dobro do risco, isso equivale a apenas 0,1% mais risco em um caso, enquanto 45% mais risco em outro caso., Assim, reportando apenas o RR exagera o efeito em primeira instância, enquanto potencialmente minimiza o efeito (ou pelo menos descontextualizando-o) em segunda instância.
Odds ratio
Enquanto relatórios de risco o número de eventos de interesse em relação ao número total de ensaios, a probabilidade de relatar o número de eventos de interesse em relação ao número de eventos, não de interesse. Dito de forma diferente, ele relata o número de eventos para os não-Eventos., Enquanto o risco, conforme determinado anteriormente, o de lançar uma moeda para ser cabeças é de 1:2 ou 50%, a probabilidade de lançar uma moeda para ser cabeças é de 1:1, como não existe um resultado desejado (evento), e um resultado indesejado (nonevent) (Figura 1).
assim como com RR, onde a proporção de dois riscos foi levado por dois grupos separados, a razão de duas probabilidades pode ser tomada por dois grupos separados para produzir um odds ratio (or)., Em vez de relatar quantas vezes o risco que um grupo tem em relação ao outro, ele relata quantas vezes as probabilidades que um grupo tem para o outro.
para a maioria, esta é uma estatística mais difícil de entender. O risco é muitas vezes um conceito mais intuitivo do que as probabilidades, e assim a compreensão dos riscos relativos é muitas vezes preferida à compreensão das probabilidades relativas. No entanto, ou não sofre das mesmas limitações do pressuposto causal que a RR, tornando-a mais amplamente aplicável.,
por exemplo, as probabilidades são uma medida simétrica, o que significa que, embora o risco apenas examine os resultados dadas as intervenções, as probabilidades também podem examinar as intervenções dadas os resultados. Assim, um estudo pode ser construído onde, ao invés de escolher grupos experimentais e medir resultados, os resultados podem ser escolhidos, e outros fatores podem ser analisados. O seguinte é um exemplo de um estudo de caso-controle, uma situação em que RR não pode ser usado, mas ou pode.
a 2019 case-control study proves a good example., Procurando encontrar uma correlação potencial entre uma infecção pelo vírus da hepatite A (VHA) proeminente no Canadá e algum fator causador, um estudo foi construído com base no resultado (em outras palavras, os indivíduos foram categorizados com base em seu status de VHA, como a “intervenção”, ou evento causal, era desconhecido). O estudo analisou os que tinham VHA e os que não tinham e que alimentos tinham comido antes da infecção por VHA . A partir disso, várias razões de probabilidade foram construídas comparando um item de alimento específico com o estado de HAV., Por exemplo, os dados revelaram que, entre os indivíduos que estavam expostos ao camarão/camarão, oito eram positivos para o VHA e sete Não, enquanto que para os que não estavam expostos, dois eram positivos para o VHA e 29 Não. Um rácio de probabilidades é tomado por (8:7)/(2:29) O que equivale a aproximadamente 16,6. Os dados do estudo relataram um ou de 15,75, com a pequena discrepância provavelmente originada de quaisquer ajustes pré-cálculo para variáveis confusas que não foram discutidos no artigo. Foi reportado um valor p de 0,01, fornecendo assim dados estatísticos para este efeito ou sendo significativo.,
isto pode ser interpretado de duas maneiras iguais. Em primeiro lugar, as probabilidades de exposição do camarão/camarão para aqueles com VHA são 15.75 vezes mais elevadas do que para aqueles sem. Equivalentemente, a probabilidade de HAV-positve versus HAV-negativo é 15.75 vezes maior para aqueles expostos a camarões do que para aqueles não expostos.
Global, or provides a measure of the strength of association between two variables on a scale of 1 being no association, above 1 being a positive association, and below 1 being a negative association., Embora as duas interpretações anteriores estejam corretas, elas não são tão diretamente compreensíveis quanto um RR teria sido, se tivesse sido possível determinar uma. Uma interpretação alternativa é a de que existe uma forte correlação positiva entre a exposição ao camarão/camarão e o VHA.por isso, em alguns casos específicos, é apropriado aproximar RR com ou. Nestes casos, a assunção de doenças raras deve manter-se. Ou seja, uma doença deve ser extremamente rara dentro de uma população., Neste caso, o risco da doença dentro da população(p/(p+q)) aproxima-se das probabilidades da doença dentro da população (p / q) à medida que p se torna insignificante em relação a Q. assim, a RR e ou converge à medida que a população se torna maior. No entanto, se esta hipótese falhar, a diferença torna-se cada vez mais exagerada. Matematicamente, em ensaios p+q, A diminuição de P aumenta q para manter os mesmos ensaios totais. Com risco, apenas o numerador muda, enquanto que com probabilidades tanto o numerador quanto o denominador mudam em direções opostas., Consequentemente, nos casos em que o RR e ou são ambos inferiores a 1, O OR subestimará o RR, enquanto nos casos em que ambos são superiores a 1, O OR sobrestimará o RR.
reportagens erradas do Ou como RR, então, pode muitas vezes exagerar os dados. É importante lembrar que ou é uma medida relativa apenas como RR, e, portanto, às vezes um grande ou pode corresponder com uma pequena diferença entre probabilidades.
para os relatórios mais fiéis, então, ou não devem ser apresentados como um RR, e só devem ser apresentados como uma aproximação de RR se a assunção de doenças raras puder ser razoavelmente válida., Se possível, deve ser sempre comunicado um RR.rácios de perigo tanto a RR como as intervenções e os resultados, reportando-se assim ao longo de todo o período de estudo. No entanto, uma medida semelhante, mas distinta, a razão de perigo (RH), diz respeito às taxas de variação (Quadro 1).
Tabela 1
RR | OU | HR | |
Objetivo | Determinar o relacionamento em risco o status baseado em algumas variáveis. | Determinar a associação entre duas variáveis. | Determinar como um grupo muda em relação a outro., |
Use | nos diz como uma intervenção muda os riscos. | Nos Diz se existe uma associação entre uma intervenção e o risco; estima-se como esta associação se aplica. | nos diz como uma intervenção muda a taxa de experimentar um evento. |
limitações | apenas aplicável se a concepção do estudo for representativa da população. Não pode ser utilizado em estudos de controlo de casos., | pode geralmente ser aplicado em todos os lugares, mas nem sempre uma estatística útil em si. Exagera os riscos. | para ser tipicamente útil, a taxa de mudança dentro de dois grupos deve ser relativamente consistente. |
linha do tempo | Static – não considera taxas. Resume um estudo global. | Static-does not consider rates. Resume um estudo global. | baseado em taxas., Fornece informações sobre a forma como um estudo progride ao longo do tempo. |
HRs estão em conjunto com curvas de sobrevivência, que mostram a progressão temporal de algum evento dentro de um grupo, quer esse evento seja morte, ou contraindo uma doença. Em uma curva de sobrevivência, o eixo vertical corresponde ao evento de interesse e o eixo horizontal corresponde ao tempo. O perigo do evento é então equivalente ao declive do grafo, ou os eventos por tempo.uma razão de perigo é simplesmente uma comparação de dois perigos., Ele pode mostrar quão rapidamente duas curvas de sobrevivência divergem através da comparação das encostas das curvas. Um HR de 1 indica nenhuma divergência-dentro de ambas as curvas, a probabilidade do evento foi igualmente provável em qualquer momento. Um HR não igual a 1 indica que dois eventos não estão ocorrendo a uma taxa igual, e o risco de um indivíduo em um grupo é diferente do risco de um indivíduo em outro em um determinado intervalo de tempo.
uma suposição importante que HRs fazem é a suposição de taxas proporcionais., Para comunicar uma razão de perigo singular, deve assumir-se que as duas taxas de perigo são constantes. Se a inclinação do grafo for alterada, a razão também mudará ao longo do tempo, e assim não será aplicada como uma comparação de probabilidade em qualquer momento.considere o ensaio de um novo agente quimioterapêutico que procura prolongar a esperança de vida de doentes com um cancro específico. Tanto na intervenção como no grupo de controlo, 25% tinham morrido na semana 40., Uma vez que ambos os grupos diminuíram de 100% de sobrevivência para 75% de sobrevivência durante o período de 40 semanas, as taxas de perigo seriam iguais e, portanto, a taxa de perigo seria igual a 1. Isto sugere que um indivíduo que recebe a droga é tão provável de morrer como aquele que não recebe a droga a qualquer momento.
no entanto, é possível que no grupo de intervenção, todos os 25% morreram entre as semanas seis a 10, enquanto no grupo de controlo, todos os 25% morreram dentro das semanas 1 a 6. Neste caso, comparar medianos mostraria uma maior expectativa de vida para aqueles que estão na droga, apesar da HR não mostrar nenhuma diferença., Neste caso, a hipótese proporcional dos perigos falha, à medida que as taxas de perigo mudam (de forma bastante dramática) ao longo do tempo. Em casos como este, HR não é aplicável.por vezes, é difícil determinar se a hipótese proporcional dos perigos se aplica de forma razoável e porque, tomando uma tira de HR, a medição original (taxas de perigo) da unidade de tempo, é prática corrente comunicar a HR em conjunto com os tempos medianos.,
Em um estudo para avaliar o prognóstico de desempenho das Rápida Medicina de Emergência Pontuação (REMS) e o Worthing Fisiológicas sistema de Pontuação (WPSS), os investigadores descobriram que o risco de mortalidade em 30 dias foi aumentado em 30% para cada adicional REMS (unidade de RH: 1.28; 95% de intervalo de confiança (IC): 1.23-1.34) e em 60% por cada adicional WPSS unidade (HR: 1.6; 95% CI: 1.5-1.7). Neste caso, a taxa de mortalidade não mudou, mas sim o sistema de pontuação para prever isso, de modo que o HR pode ser usado. Ter um intervalo de confiança entre 1,5 e 1.,7 para o rácio de perigos WPSS indica que a curva de mortalidade para aqueles com um WPS mais elevado declina a uma taxa mais rápida (cerca de 1, 5-1, 7 vezes). Uma vez que o limite baixo do intervalo ainda está acima de 1, Estamos confiantes de que o verdadeiro perigo de morte dentro de 30 dias é maior para o grupo com WPS mais elevados .
Em 2018 estudo sobre o consumo excessivo de álcool entre pessoas com determinados factores de risco, uma curva de sobrevivência foi construído plotando a taxa de alcançar a bebedeira para controles, aqueles com história familiar, sexo masculino, aqueles com alta impulsividade, e aqueles com maior resposta ao álcool., Para os homens e aqueles com uma história familiar, foi relatada evidência estatisticamente significativa para uma maior taxa de alcançar bebedeira compulsiva (um HR de 1,74 para os homens e 1,04 para aqueles com uma história familiar) . No entanto, para aqueles com alta impulsividade, embora a HR foi de 1,17, o intervalo de confiança de 95% variou de 1,00 a 1,37. Assim, para um nível de confiança de 95%, é impossível descartar que o HR era 1,00.,
Por causa do exagero presente, é importante evitar representar ORs como RRs, e da mesma forma, é importante reconhecer que um relatado ou raramente fornece uma boa aproximação dos riscos relativos, mas simplesmente fornece uma medida de correlação.
devido à sua capacidade de chegar a conclusões firmes e compreender, a RR deve ser reportada, se possível, no entanto, nos casos em que a sua presunção de causalidade é violada (tais como estudos de controlo de casos e regressão logística), Ou Pode ser utilizada.,
HRs são usadas com curvas de Sobrevivência e assumem que as taxas de perigo são iguais ao longo do tempo. Embora úteis para comparar duas taxas, devem ser reportadas com tempos medianos para justificar o pressuposto proporcional de perigos.finalmente, independentemente do valor da HR/RR/ou Estatística, uma interpretação só deve ser feita após determinar se o resultado fornece evidência estatisticamente significativa para uma conclusão (determinada pelo valor p ou pelo intervalo de confiança)., Recordar estes princípios e a estrutura de HR/RR/ou minimiza a deturpação e impede que se retirem conclusões incorretas dos resultados de um estudo publicado sobre várias amostras. A figura 2 resume a utilização correcta e incorrecta destes vários rácios de risco.
Leave a Reply