O teorema do limite central: o que é grande o suficiente

Em poucas palavras, o Teorema do Limite Central diz que você pode usar a distribuição normal para descrever o comportamento de uma média de amostra, mesmo se os valores individuais que compõem a média da amostra não são normais si. Mas isso só é possível se o tamanho da amostra é “grande o suficiente.” Muitos livros estatísticas diria que n

teria que ser de pelo menos 30.

Mas porque é que n = 30 o ponto de referência? Muitas variáveis ​​na natureza, finanças e outras aplicações têm uma distribuição que é muito perto da curva normal. Por exemplo, ao olhar para o t-mesa, você vê que os vários valores de t começar a ficar realmente perto dos valores de z pelo tempo que você atingiu cerca de 30 graus de liberdade. Uma razão para isso é que o t-distribuições e as compartilham duas características normais de distribuição importantes: Eles são simétricas, e eles são unimodal (tendo um pico).

Se a distribuição de seus valores de dados individuais está longe de qualquer uma destas qualidades, você pode precisar de mais do que um tamanho de amostra de 30 para usar o Teorema do Limite Central. Quanto mais longe os dados é de ser simétrica e unimodal, mais dados que você precisa.

Simetria

Se você souber ou suspeitar que a sua distribuição pai não é simétrica em torno da média, então você pode precisar de um tamanho da amostra que é significativamente maior do que 30 para obter o possível amostra significa olhar normal (e, portanto, usar o Teorema do Limite Central).

Considere o seguinte direito; histograma enviesada, que registra o número de animais de estimação por agregado familiar.

Agora, suponha que ele representa toda a população das famílias. Você repetidamente amostra n = 30 famílias daquela população. Aqui está o que a distribuição de possíveis amostra significa parece.



Você pode ver que essa distribuição não é normal, porque a cauda direita ainda se estende mais longe do pico central do que a cauda esquerda faz. Não é simétrica. Para esta população, você precisa tomar uma amostra de cerca de n = 100 para obter a amostra meios para se fixarem em uma curva simétrica.

unimodal

Se você souber ou suspeitar que a sua distribuição pai não é unimodal e tem mais de um pico, então você pode precisar de mais do que 30 em sua amostra para se sentir bem sobre como usar o Teorema do Limite Central.

Considere o seguinte histograma população multimodal com três picos distintos.

Se você só amostra n = 30 do que a população, você começa uma distribuição unimodal, mas ainda não é completamente simétrica.

Para esta população, você precisa tomar uma amostra de pelo menos n = 50 para se sentir confortável que a sua média amostral de distribuição é aproximadamente normal.


Publicações relacionadas