Como calcular uma correlação

Pode uma medida estatística tanto a força ea direção de uma relação linear entre duas variáveis? Certo! Os estatísticos usar o coeficiente de correlação

para medir a força e direcção da relação linear entre duas variáveis ​​numéricos X e Y. O coeficiente de correlação para uma amostra de dados é designado por r.

Embora a definição rua de correlação aplica-se a quaisquer dois itens que estão relacionados (tais como sexo e filiação política), estatísticos usar esse termo apenas no contexto de duas variáveis ​​numéricas. O termo formal para a correlação é a coeficiente de correlação. Muitos diferentes medidas de correlação foram Criado- o utilizado neste caso é chamado de coeficiente de correlação de Pearson.

A fórmula para a correlação (r) é

Onde n é o número de pares de dados;

são as médias das amostras de todo o X-valores e toda a y-valores, respectivamente- e sX e sy são os desvios padrão das amostras de todo o X- e y-valores, respectivamente.

Você pode utilizar os seguintes passos para calcular a correlação, r, a partir de um conjunto de dados:

  1. Encontre a média de toda a X-valores

  2. Encontre o desvio padrão de todos os X-valores (chamá-lo sX) E o desvio padrão de todos os y-valores (chamá-lo sy).

    Por exemplo, para encontrar sX, você usaria a seguinte equação:



  3. Para cada um dos n pares (X, y) No conjunto de dados, levar

  4. Junte-se o n resultados do Passo 3.

  5. Divida a soma por sX * sy.

  6. Divida o resultado por n - 1, onde n é o número de (X, y) pares. (É o mesmo que multiplicar por 1 mais n - 1.)

    Isso lhe dá a correlação, r.

Video: Coeficiente de Correlação de Pearson - Cálculo

Por exemplo, suponha que você tenha o conjunto de dados (3, 2), (3, 3) e (6, 4). Você calcular o coeficiente de correlação r através dos seguintes passos. (Note-se que para estes dados a X-Os valores são 3, 3, 6, e o y-Os valores são 2, 3, 4.)

  1. Calculando a média dos valores X e Y, você começa

  2. Os desvios padrão são sX = 1,73 e sy = 1,00.

  3. o n = 3 diferenças encontradas no Passo 2 multiplicados em conjunto são: (3-4) (2-3) = (- 1) (- 1) = + 1- (3-4) (3-3) = (- 1) ( 0) = 0- (6-4) (4-3) = (2) (1) = 2.

  4. adicionando o n = 3 Passo 3 resultados, você tem 1 + 0 + 2 = 3.

  5. dividindo por sX * sy dá-lhe 3 / (1,73 * 1,00) = 3 / 1,73 = 1,73. (É apenas uma coincidência que o resultado do Passo 5 é também 1,73).

    Video: Como calcular o coeficiente de correlação no R

  6. Agora dividir o resultado Passo 5 por 3 - 1 (que é 2), e você começa a correlação r = 0,87.


Publicações relacionadas