Os 10 fórmulas estatísticas

Fórmulas - você simplesmente não pode ficar longe deles quando você está estudando estatísticas. Aqui estão dez fórmulas estatísticas que você usa com freqüência e os passos para calculá-los.

Proporção

Algumas variáveis ​​são categóricos e identificar qual categoria ou grupo um indivíduo pertence. Por exemplo, “status de relacionamento” é uma variável categórica, e um indivíduo pode ser único, datar, casado, divorciado, e assim por diante.

O número real de indivíduos em qualquer categoria é chamado de freqüência para essa categoria. UMA proporção, ou frequência relativa, representa a percentagem de indivíduos que cai em cada categoria. A proporção de uma determinada categoria, denotada por p, é a frequência dividida pelo tamanho total da amostra.

Assim, para calcular a proporção, você

  1. Contar todos os indivíduos da amostra que se enquadram na categoria especificada.

  2. Dividido por n, o número de indivíduos na amostra.

Significar

o significar, ou o média de um conjunto de dados, é uma maneira de medir o centro de um conjunto de dados numéricos. A notação para a média é

A fórmula para a média é

Onde X representa cada um dos valores no conjunto de dados.

Para calcular a média, você

  1. Somar todos os números no conjunto de dados.

  2. Dividido por n, o número de valores no conjunto de dados.

Mediana

o mediana de um conjunto de dados numérica é outra maneira de medir o centro. A mediana é o valor médio depois de ordenar os dados do menor ao maior.

Para calcular a mediana, percorrer os seguintes passos:

  1. Ordenar os números do menor ao maior.

  2. Para uma quantidade ímpar de números, escolher aquele que cai exatamente no meio. Você já identificou a mediana.

  3. Para uma quantidade ainda de números, levar os dois números exatamente no meio e média-los para encontrar a mediana.

desvio padrão da amostra

o desvio padrão de uma amostra é uma medida da quantidade de variabilidade na amostra. Você pode pensar nisso, em termos gerais, como a distância média da média. A fórmula para o desvio padrão é

Para calcular o desvio padrão, você

  1. Encontre a média de todos os números,

  2. Tome cada número e subtrair a média a partir dele.

  3. Quadrado cada um dos valores resultantes.

  4. Adicioná-los todos para cima.

  5. Dividido por n - 1.

  6. Tirar a raiz quadrada.

percentil

percentis são um modo para determinar um valor relativo individual para todos os outros valores de um conjunto de dados. Quando tomar um teste padronizado, você recebe uma pontuação bruta individual e um percentil. Se você entrar em no percentil 90, por exemplo, 90 por cento dos resultados dos testes de todos os alunos são as mesmas ou abaixo de seu (e 10 por cento estão acima seu). De um modo geral, estar no kmeios percentil k por cento da mentira dados em ou abaixo desse ponto e (100 - k) Por cento mentira acima dela.

Para calcular um percentual, você

  1. Converter o valor original para um escore padrão, utilizando o z-Fórmula,

    Onde X é o valor original,

    é a média da população de todos os valores, e

    é o desvio padrão da população de todos os valores.

  2. Use o Z-tabela para encontrar o percentil correspondente para o escore padrão.

Margem de erro para a média da amostra

o margem de erro para o seu mea amostran,

é a quantidade que você espera a média da amostra a variar de amostra para amostra. A fórmula para a margem de erro para

lidar com amostras de tamanho 30 ou mais, é

Onde z* É o valor normal padrão para o nível de confiança que você deseja.

Para calcular a margem de erro para

você

  1. Determinar o nível de confiança e encontrar a adequada z*.

  2. Encontre o desvio padrão

    e o tamanho da amostra, n.

  3. Multiplicar z* de

    dividido pela raiz quadrada de n.

O tamanho da amostra necessária

Se você quiser calcular um intervalo de confiança para a média da população com uma certa margem de erro, você pode descobrir o tamanho da amostra que você precisa antes de recolher quaisquer dados. A fórmula para o tamanho da amostra para



é

Onde z* É o valor normal padrão para o nível de confiança, MOE é a sua margem desejado de erro e

é o desvio padrão. Porque

é um valor desconhecido que você precisa, você pode ter que fazer um estudo piloto (pequeno estudo experimental) para chegar a uma estimativa para o valor do desvio padrão.

Para calcular o tamanho da amostra para

executar através dos seguintes passos:

  1. Multiplicar z* vezes s.

  2. Dividir pela margem desejada de erro, MOE.

  3. Quadrado-lo.

  4. Volta qualquer quantidade fracionada para o número inteiro mais próximo (para que você atingir o seu MOE desejado ou melhor).

estatística de teste para a média

Ao realizar um teste de hipótese para a média da população, você toma a média da amostra e descobrir o quão longe é a partir do valor reivindicado em termos de uma pontuação padrão. A pontuação padrão é chamado de statisti testec. A fórmula para a estatística de teste para a média é

Onde

é o valor reivindicados para o média da população (O valor que se senta na hipótese nula).

Para calcular a estatística de teste para a média da amostra para amostras de tamanho 30 ou mais, você

  1. Calcule a média da amostra,

    e o desvio padrão da amostra, s.

  2. Levar

  3. Calcule o erro padrão,

  4. Divida o resultado da etapa 2 pelo erro padrão encontrado na Etapa 3.

Correlação

Amostra correlação é uma medida da intensidade e direcção da relação linear entre duas variáveis ​​quantitativas X e Y. Não mede qualquer outro tipo de relacionamento, e ela não se aplica a variáveis ​​categóricas. A fórmula para a correlação é

Para calcular a correlação, você

  1. Encontre a média de toda a X valores e chamá-lo

    Encontre a média de toda a y valores e chamá-lo

  2. Encontre o desvio padrão de todos os X valores e chamá-lo sX. Encontre o desvio padrão de todos os y valores e chamá-lo sy.

  3. Para cada (X, y) Par no conjunto de dados, levar X menos

    e y menos

    e multiplicá-los juntos.

  4. Adicionar todos estes produtos em conjunto para obter uma soma.

  5. Divida a soma por sX X sy.

  6. Divida o resultado por n - 1 onde n é o número de (X, y) pares. (Esta é a mesma como a multiplicação por um longo n - 1.)

Linha de regressão

Depois de examinar um gráfico de dispersão entre duas variáveis ​​numéricas e calcular a correlação da amostra entre as duas variáveis, você pode observar uma relação linear entre eles. Nesse caso, seria apropriado para estimar a linha de regressão para estimar o valor da variável de resposta (Y) Deu um valor para a variável de motivos (X).

Antes de calcular a linha de regressão, você precisa de cinco estatísticas de resumo:

  • A média do X valores

  • A média do y valores

  • O desvio padrão do X valores (denotado sX)

  • O desvio padrão do y valores (denotado sy)

  • A correlação entre X e Y (denotado r)

Assim, para calcular a linha de regressão de melhor ajuste, você

  1. Encontre a inclinação usando a fórmula

  2. Encontre o y-intercepção usando a fórmula

  3. Reunir os resultados dos passos 1 e 2 para dar-lhe a linha de regressão: y = mx + b.


Publicações relacionadas