O método bootstrap para erros padrão e intervalos de confiança

Video: Intervalo de Confiança para desvio-padrão

Você pode calcular o erro padrão (SE) e intervalo de confiança (IC) das estatísticas da amostra mais comuns (médias, proporções, contagens de eventos e taxas, e coeficientes de regressão). Mas uma SE e CI existe (teoricamente, pelo menos) para qualquer número que poderia torcer a partir de seus dados - medianas, percentis, coeficientes de correlação, e outras quantidades que possam envolver cálculos complicados, como a área sob a curva de concentração versus tempo (AUC) ou estimada a probabilidade de sobrevivência de cinco anos derivada de uma análise de sobrevivência. Fórmulas para o SE e CI em torno destes números pode não estar disponível ou pode ser irremediavelmente difíceis de avaliar. Além disso, as fórmulas que existem pode aplicar-se apenas aos números distribuídos normalmente, e você pode não ter certeza de que tipo de distribuição de seus dados a seguir.

Considere-se um problema muito simples. Suponhamos que tenha medido o QI de 20 indivíduos e ter obtido os seguintes resultados: 61, 88, 89, 89, 90, 92, 93, 94, 98, 98, 101, 102, 105, 108, 109, 113, 114 , 115, 120, e 138. Estes números têm uma média de 100,85 e uma mediana de 99,5. Porque você é um bom cientista, você sabe que sempre que você relatar algum número que você calculado a partir de seus dados (como uma média ou mediana), você também vai querer indicar a precisão desse valor na forma de uma SE e CI.

Para a média, e se você pode assumir que os valores de QI são aproximadamente distribuídos normalmente, as coisas são muito simples. Pode-se calcular o SE da mia, como 3,54 e o IC de 95% em torno da média como 93,4-108,3.

Mas o que sobre o SE e CI para a mediana, para as quais não existem fórmulas simples? E se você não pode ter certeza que esses valores de QI vêm de uma distribuição normal? Em seguida, as fórmulas simples pode não ser confiável.

Felizmente, existe um método muito geral para estimar SEs e CIs para qualquer coisa que você pode calcular a partir de seus dados, e não necessita de quaisquer suposições sobre como os números são distribuídos. A SE de qualquer estatística da amostra é o desvio padrão (SD) da distribuição de amostragem para que estatística. E os limites de confiança de 95% de uma estatística da amostra são bem aproximada pela 2.5th e percentis 97,5 da distribuição amostral dessa estatística.

Então, se você pode replicar toda a sua experiência muitas vezes milhares (usando uma amostra diferente de assuntos de cada vez), e cada Calcular tempo e salvar o valor da coisa que você está interessado (mediana, AUC, ou qualquer outro), esta coleção de milhares de valores seria uma boa aproximação para a distribuição de amostragem da quantidade de interesse. Então você pode estimar o SE simplesmente como o SD da distribuição de amostragem e os limites de confiança dos percentis da distribuição.

Mas, na verdade, levar a cabo este cenário não é viável - você provavelmente não tem tempo, paciência ou dinheiro para realizar todo o seu milhares de estudo de vezes. Felizmente, você não tem que repetir os milhares de estudos de vezes para obter uma estimativa da distribuição amostral. Você pode fazê-lo através da reutilização dos dados de seu um estudo real, uma e outra vez! Isso pode parecer bom demais para ser verdade, e os estatísticos eram muito cético em relação a este método quando foi proposto pela primeira vez. Eles o chamaram bootstrapping, comparando-a com a impossível tarefa de “pegar-se pelo seu próprio esforço.”

Mas acontece que se você continuar reutilizando os mesmos dados de certa forma, este método realmente funciona. Ao longo dos anos, o procedimento de inicialização tornou-se uma forma aceita para obter estimativas confiáveis ​​de SEs e CIs para quase qualquer coisa que você pode calcular a partir de sua data- na verdade, é muitas vezes considerado o “padrão ouro” contra o qual várias fórmulas de aproximação para SEs e CIs são julgados.

Para ver como o método bootstrap funciona, aqui está como você iria utilizá-lo para estimar o SE e IC 95% da média ea mediana dos valores 20 de QI mostrados anteriormente. Você tem que resample seus 20 números, uma e outra vez, da seguinte maneira:

  1. Escrever cada uma de suas medições em um pedaço de papel separado e colocá-los todos em um saco.

    Neste exemplo, você escreve os 20 QI medidos em tiras separadas.

  2. Alcançar e tirar um deslize, escrever esse número para baixo, e colocar a escorregar de volta para o saco.

    (Essa última parte é muito importante!)

  3. Repita a Etapa 2 tantas vezes quantas forem necessárias para corresponder ao número de medições que você tem, devolvendo o deslizamento para o saco de cada vez.

    Isso é chamado de resampling com replacement, e produz um resampled conjunto de dados. Neste exemplo, repetir o passo 2 19 mais vezes, para um total de 20 vezes (o qual é o número de medições de QI tiver).

  4. Calcular a estatística de amostra desejada dos números reamostrados dos passos 2 e 3, e registar esse número.

    Neste exemplo, você encontra a média ea mediana dos 20 números refeita.

  5. Repita os passos 2 a 4 milhares de vezes.

    Cada vez, você gerar um novo resampled conjunto de dados do qual você calcular e registrar as estatísticas de amostra desejada (neste caso, a média ea mediana do conjunto de dados resampled). Você acabar com milhares de valores para a média e milhares de valores para a mediana.

    Em cada conjunto de dados reamostrada, alguns dos valores originais podem ocorrer mais de uma vez, e alguns podem não estar presentes em todos os. Quase todos os conjunto de dados resampled será diferente de todos os outros. O método de bootstrap baseia-se no facto de que estes valores médios e medianos dos milhares de conjuntos de dados reamostrados compreendem uma boa estimativa da distribuição da amostragem para a média e mediana. Coletivamente, eles lembram o tipo de resultados você pode ter obtido se tivesse repetido o estudo real e outra vez.

  6. Calcular o desvio padrão dos seus milhares de valores da estatística da amostra.



    Este processo dá-lhe uma estimativa “bootstrap” do SE da amostra estatística. Neste exemplo, você calcular o SD dos milhares de meios para obter a SE da média, e você calcular o SD dos milhares de medianas para obter o SE da mediana.

  7. Obter o 2.5th e percentis 97,5 dos milhares de valores da estatística da amostra.

    Para fazer isso, a classificação de seus milhares de valores da estatística da amostra em ordem numérica, e depois cortando o menor 2,5 por cento eo máximo de 2,5 por cento do conjunto classificado de números. Os valores menores e maiores que permanecem são a estimativa bootstrap de limites de confiança de baixas e altas de 95% para a amostra estatística.

    Neste exemplo, o 2.5th e percentis 97,5 das médias e as medianas dos milhares de conjuntos de dados reamostrados são os limites de confiança de 95% para a média e mediana, respectivamente.

Obviamente você nunca tentar fazer este processo bootstrapping com a mão, mas é muito fácil de fazer com software como o programa gratuito Statistics101. Você pode inserir seus resultados observados e dizer-lhe para gerar, digamos, 100.000 conjuntos de dados reamostrados, calcular e salvar a média ea mediana de cada um, e, em seguida, calcular o SD eo 2.5th e percentis 97,5 desses 100.000 meios e 100.000 medianas. Aqui estão alguns resultados de uma análise de bootstrap realizada nesta data:

Video: Curso de Probabilidade e Estatística Esperança Matemática VALOR ESPERADO Questão ocorrência números

dados reais: 61, 88, 89, 89, 90, 92, 93, 94, 98, 98, 101, 102, 105, 108, 109, 113, 114, 115, 120, e 138. Média = 100.85- Média = 99,5

Resampled conjunto de dados #1: 61, 88, 88, 89, 89, 90, 92, 93, 98, 102, 105, 105, 105, 109, 109, 109, 109, 114, 114, e 120. Média1 = 99,45, Mediana1 = 103,50

Resampled conjunto de dados #2: 61, 88, 89, 89, 90, 92, 92, 98, 98, 98, 102, 105, 105, 108, 108, 113, 113, 113, 114, e 138. Média2 = 100,7, Mediana2 = 100,0

(Entre Conjunto # 2 e o seguinte conjunto, 99,996 conjuntos de dados mais bootstrap foram gerados.)

Resampled conjunto de dados #99,999: 61, 61, 88, 89, 92, 93, 93, 94, 98, 98, 98, 101, 102, 105, 109, 114, 115, 120, 120, e 138. Média99.999 = 99,45, Mediana99.999 = 98.00

Resampled conjunto de dados #100,000: 61, 61, 61, 88, 89, 89, 90, 93, 93, 94, 102, 105, 108, 109, 109, 114, 115, 115, 120, e 138. Média100.000 = 97,7, Mediana100.000 = 98,0

Aqui está um resumo dos 100.000 resamples:

  • O SD da 100000 significars = 3.46- este é o bootstrap SE da mia (SEM).

  • O SD da 100000 medianas = 4.24- este é o bootstrap SE da mediana.

  • Os 2.5th e 97,5 percentis da 100000 significa = 94,0 107.6- e estes são os limites de confiança de 95% para o bootstrap significar.

  • Os 2.5th e 97,5 percentis da 100000 medianas = 92,5 108.5- e estes são os limites de confiança de 95% para o bootstrap mediana.

Então você iria relatar a sua média e mediana, juntamente com os seus bootstrapped erros padrão e 95% intervalo de confiança desta forma:

Média = 100,85 ± 3,46 (94,0-107,6) - Média = 99,5 ± 4,24 (92,5-108,5).

Você notará que a SE é maior (e do CI é mais largo) para a mediana do que para a média. Isto é geralmente verdadeiro para dados com distribuição normal - a mediana tem cerca de 25% mais do que a variabilidade da média. Mas, para dados não-normalmente distribuídos, a mediana é muitas vezes mais preciso do que a média.

Você não precisa usar bootstrapping para algo tão simples como a SE ou CI de uma média porque há fórmulas simples para isso. Mas o método bootstrap pode facilmente calcular a SE ou CI por uma média, um coeficiente de correlação, ou um parâmetro farmacocinético como a AUC ou semi-vida de uma droga, para a qual não há simples fórmulas e para que SE ou CI os pressupostos de normalidade podem não se aplicar.

Bootstrapping é conceitualmente simples, mas não é infalível. O método envolve certas suposições e tem certas limitações. Por exemplo, ele provavelmente não vai ser muito útil se você tiver apenas alguns valores observados. Confira estatísticas 101 Para mais informações sobre como utilizar o método de inicialização (e para o software Statistics101 livre para fazer os cálculos de bootstrap muito facilmente).


Publicações relacionadas