(Valor aproximado) simulando o teorema limite central em excel
Para ajudar você a entender a análise estatística com Excel, que ajuda a simular o Teorema do Limite Central. Ele quase não parece certo. Como pode uma população que está não distribuídos normalmente resultam numa distribuição de amostragem normalmente distribuídos?
Conteúdo
Para lhe dar uma ideia de como o Teorema do Limite Central funciona, há uma simulação. Esta simulação cria algo como uma distribuição de amostragem da média para uma amostra muito pequena, com base em uma população que não é normalmente distribuído. Como você verá, ainda que a população não é uma distribuição normal, e mesmo que a amostra é pequena, a distribuição amostral da média parece um pouco como uma distribuição normal.
Imagine uma enorme população que consiste em apenas três contagens - 1, 2 e 3 - e cada um é a mesma probabilidade de aparecer em uma amostra. Imagine também que você pode selecionar aleatoriamente uma amostra de três contagens de população.
Amostra | Significar | Amostra | Significar | Amostra | Significar |
1,1,1 | 1,00 | 2,1,1 | 1.33 | 3,1,1 | 1,67 |
1,1,2 | 1.33 | 2,1,2 | 1,67 | 3,1,2 | 2,00 |
1,1,3 | 1,67 | 2,1,3 | 2,00 | 3,1,3 | 2,33 |
1,2,1 | 1.33 | 2,2,1 | 1,67 | 3,2,1 | 2,00 |
1,2,2 | 1,67 | 2,2,2 | 2,00 | 3,2,2 | 2,33 |
1,2,3 | 2,00 | 2,2,3 | 2,33 | 3,2,3 | 2,67 |
1,3,1 | 1,67 | 2,3,1 | 2,00 | 3,3,1 | 2,33 |
1,3,2 | 2,00 | 2,3,2 | 2,33 | 3,3,2 | 2,67 |
1,3,3 | 2,33 | 2,3,3 | 2,67 | 3,3,3 | 3.00 |
Se você olhar atentamente para a tabela, você quase pode ver o que está prestes a acontecer na simulação. A média da amostra que aparece com mais frequência é de 2,00. As médias da amostra que aparecem menos frequentemente são 1,00 e 3,00. Hmmm. . . .
Na simulação, uma pontuação foi seleccionado aleatoriamente a partir da população e, em seguida, seleccionar aleatoriamente mais duas. Aquele grupo de três pontos é uma amostra. Então você calcular a média dessa amostra. Este processo foi repetido para um total de 60 amostras, resultando em 60 meio de exemplo. Finalmente, você gráfico da distribuição das médias amostrais.
O que faz a distribuição amostral simulado da média parece? A imagem abaixo mostra uma planilha que responde a esta pergunta.
Video: Teorema Central del Límite 01/04
Na planilha, cada linha é uma amostra. As colunas rotuladas x1, x2, x3 e mostrar as três pontuações para cada amostra. Coluna E apresenta a média para a amostra em cada linha. Coluna G mostra todos os valores possíveis para a média da amostra, e a coluna H mostra a frequência com que cada um significa aparece nas 60 amostras. Colunas G e H, e o gráfico, mostram que a distribuição tem a sua máxima frequência quando a média da amostra é de 2,00. A cauda freqüências fora como a amostra significa obter mais e mais longe de 2.00.
O ponto de tudo isso é que a população parece em nada com uma distribuição normal eo tamanho da amostra é muito pequena. Mesmo sob essas restrições, a distribuição amostral da média com base em 60 amostras começa a parecer muito com uma distribuição normal.
Video: Teorema central del limite en excel (Recorded with https://screencast-o-matic.com)
E sobre os parâmetros do Teorema do Limite Central prediz para a distribuição de amostragem? Comece com a população. A média da população é de 2,00 e o desvio padrão da população é 0,67. (Este tipo de população exige um pouco de matemática um pouco extravagantes para descobrir os parâmetros.)
Video: Teorema do Limite Central
Para a distribuição amostral. A média dos 60 meios é de 1,98, e o seu desvio padrão (uma estimativa do erro padrão da média) é 0,48. Esses números aproximam os parâmetros de limite central Teorema-previstos para a distribuição de amostragem da média, 2,00 (igual à média da população) e 0,47 (o desvio padrão, 0,67, dividida pela raiz quadrada de três, o tamanho da amostra) .
No caso de você estiver interessado em fazer esta simulação, aqui estão os passos:
- Selecione uma célula para o seu primeiro número sorteado.
Selecione a célula B2. - Use a função de planilha
RANDBETWEEN
para seleccionar um, dois, ou três.
Este desenho simula um número a partir de uma população que consiste nos números 1, 2, e 3, onde tem uma oportunidade igual de selecção de cada número. Você pode selecionarFÓRMULAS | Matemática & trig | RANDBETWEEN
e usar a caixa de diálogo Argumentos da função ou apenas tipo= RANDBETWEEN (1,3)
em B2 e pressione Enter. O primeiro argumento é o menor número RANDBETWEEN retornos, eo segundo argumento é o maior número. - Selecione a célula à direita da célula original e escolher um outro número aleatório entre 1 e 3. Faça isso novamente para um terceiro número aleatório na célula à direita da segunda.
A maneira mais fácil de fazer isso é para preencher automaticamente as duas células à direita das células originais. Nesta folha de trabalho, estas duas células são C2 e D2. - Considere estas três células para ser uma amostra, e calcular o seu significativo na célula para a direita da terceira célula.
A maneira mais fácil de fazer isso é simplesmente tipo= MÉDIA (B2: D2)
na célula E2 e pressione Enter. - Repita este processo para tantas amostras como você deseja incluir na simulação. Tem cada linha corresponde a uma amostra.
60 amostras foram utilizadas aqui. A maneira rápida e fácil de conseguir este feito é selecionar a primeira linha de três números escolhidos aleatoriamente e sua média e, em seguida, preencher automaticamente as linhas restantes. O conjunto da amostra significa em coluna E é a distribuição de amostras simulado da média. Usar MÉDIA
e STDEV.P
para encontrar sua média e desvio padrão.
Para ver o que esta distribuição amostral simulado parece, utilize a função de matriz FREQÜÊNCIA
na amostra significa em coluna E. Siga estes passos:
- Introduzir os valores possíveis da média da amostra para uma matriz.
Você pode usar coluna G para isso. É possível expressar os valores possíveis de média da amostra em forma de fracção (3/3, 4/3, 5/3, 6/3, 7/3, 8/3, e 9/3) como os introduzidos nas células G2 através G8. Excel converte-os em forma decimal. Certifique-se essas células estão em formato de número. - Seleccionar uma matriz para as frequências dos possíveis valores da média da amostra.
É possível utilizar coluna H para manter as frequências, selecionando células H2 através H8. - A partir do menu Funções estatísticas, selecione
FREQÜÊNCIA
para abrir a caixa de diálogo Argumentos da função paraFREQÜÊNCIA
- Na caixa de diálogo Argumentos da função, digite os valores apropriados para os argumentos.
Na caixa matriz_dados, entrar nas células que possuem os meios de amostra. Neste exemplo, isso é E2: E61. - Identificar a matriz que contém os valores possíveis de média da amostra.
FREQÜÊNCIA
detém essa matriz na caixa de matriz_bin. Por esta planilha, G2: G8 vai para a caixa de matriz_bin. Depois de identificar as duas matrizes, a caixa de diálogo Argumentos da função mostra as freqüências dentro de um par de chaves. - Pressione Ctrl + Shift + Enter para fechar a caixa de diálogo Argumentos da função e mostrar as freqüências.
Utilize esta combinação de teclas, porqueFREQÜÊNCIA
é uma função de matriz. - Finalmente, com H2: H8 destacado, selecione
Insira | Gráficos Recomendados
e escolher o layout de coluna em cluster para produzir o gráfico das frequências. O gráfico provavelmente vai olhar um pouco diferente da minha, porque você provavelmente vai acabar com número aleatório diferente.
Video: Teorema do Limite Central: Minions
By the way, Excel repete o processo de seleção aleatório sempre que você fizer algo que faz com que Excel para recalcular a planilha. O efeito é que os números podem mudar à medida que você trabalha com isso. (Isto é, você executar novamente a simulação.) Por exemplo, se você voltar e preencher automaticamente uma das linhas novamente, os números mudam e as mudanças de gráficos.