Como lidar com a multiplicidade de dados de ensaios clínicos

Toda vez que você executar um teste de significância estatística, você corre o risco de ser enganado por flutuações aleatórias em pensar que algum efeito real está presente em seus dados quando, na verdade, não existe.

Este cenário é chamado de erro de tipo I. Quando você diz que você precisa p lt; 0,05 para significância, você está testando no 0,05 (ou 5 por cento) nível alfa ou dizendo que pretende limitar a sua taxa de erro Tipo I a 5 por cento. Mas essa taxa de erro de 5 por cento aplica-se a todo e qualquer teste estatístico de executar.

Quanto mais as análises que você executar em um conjunto de dados, quanto mais o seu nível de alfa global aumenta: Execute dois testes e sua chance de pelo menos um deles saindo falsamente significativa é de cerca de 10 per- correr 40 testes, e ao nível global alfa salta para 87 por cento. Isso é conhecido como o problema da MultiplicEuty, ou como Tipo de inflação I erro.

Alguns métodos estatísticos envolvendo múltiplas comparações (como testes post-hoc seguintes uma ANOVA para comparação de vários grupos) incorporar um ajuste embutido para manter a alfa global de apenas 5 por cento em todas as comparações. Mas quando você está testando diferentes hipóteses, como comparar variáveis ​​diferentes em momentos diferentes entre os diferentes grupos, cabe a você decidir que tipo de estratégia de controle alfa (se houver) que você deseja implementar.

Você tem várias opções, incluindo o seguinte:

  • Não controlam o multiplicidade e aceitar a probabilidade de que alguns de seus resultados “significativos” será falsamente significativa. Esta estratégia é frequentemente utilizado com hipóteses relacionadas ao secundário e exploratória objectivos- o protocolo afirma geralmente que há inferências finais serão feitas a partir desses testes exploratórios. Quaisquer resultados “significativos” será considerado apenas “sinais” de possíveis efeitos reais e terá de ser confirmado em estudos posteriores antes de quaisquer conclusões finais são desenhados.

  • Controlar o nível alfa através apenas as hipóteses mais importantes. Se você tem dois objetivos co-primários, você pode controlar alfa através dos testes de estes dois objectivos.



    Você pode controlar alfa para 5 por cento (ou a qualquer nível desejado) através de um conjunto de n testes de hipóteses em várias maneiras-seguintes são alguns dos mais populares:

  • O ajustamento de Bonferroni: Testar cada hipótese no 0,05 /n nível alfa. Então, para controlar alfa global de 0,05 em dois parâmetros primários, você precisa p lt; 0,025 para significância ao testar cada uma.

  • A estratégia de ensaio hierárquica: Posição seus terminais em ordem decrescente de importância. Teste o mais importante em primeiro lugar, e se dá p lt; 0,05, concluímos que o efeito é real. Em seguida, teste o próximo mais importante, mais uma vez usando p lt; 0,05 para a significância.

    Continue até obter um resultado não significante (p gt; 0,05) -, em seguida, interromper o teste (ou considerar todos os outros testes para ser apenas exploratória e não tirar quaisquer conclusões formais sobre eles).

  • Controlando a taxa de detecção falsa (FDR): Esta abordagem tornou-se popular nos últimos anos para lidar com a multiplicidade de grande escala, que surge em áreas como teste genômico e análise de imagem digital que pode envolver muitos milhares de testes (como um por gene ou um por pixel), em vez de apenas alguns .

    Em vez de tentar evitar até mesmo uma solteiro falsa conclusão de significância (como a outros métodos de controle alpha clássico Bonferroni e fazer), você simplesmente quer controlar a proporção de testes que saem falsamente positiva, limitando taxa de descoberta de que falsas para uma fração razoável de todos os testes. Estes resultados positivos podem então ser testados em um estudo de acompanhamento.


Publicações relacionadas