Desvio padrão, variância, e o coeficiente de variação de dados biostatística
o desvio padrão (Geralmente abreviado SD, SD, ou apenas s) De um monte de números diz-lhe quanto os números individuais tendem a ser diferentes (em qualquer direção) da média. Ele é calculado da seguinte forma:
Esta fórmula é dizer que você calcular o desvio padrão de um conjunto de N (númerosXEu) Subtraindo a média de cada valor para obter o desvio (dEu) De cada valor da média, em quadratura com cada um desses desvios, adicionando-se o
termos, dividindo por N - 1, e em seguida, tomando a raiz quadrada.
Este é quase idêntica à fórmula para o desvio da raiz quadrada média dos pontos a partir da média, excepto que tem N - 1 no denominador em vez de N. Esta diferença ocorre porque a média da amostra é usada como uma aproximação da verdadeira média da população (que você não sabe). Se a média verdadeira estavam disponíveis para uso, o denominador seria N.
Quando se fala de distribuição da população, o SD descreve a largura da curva de distribuição. A figura mostra três distribuições normais. Todos eles têm uma média de zero, mas eles têm diferentes desvios-padrão e, portanto, diferentes larguras. Cada curva de distribuição tem uma área total de exactamente 1,0, de modo que a altura do pico é menor quando o DP é maior.
Para um exemplo de QI (84, 84, 89, 91, 110, 114, e 116), em que a média é de 98,3, calcular o DP como se segue:
Os desvios padrão são muito sensíveis aos valores extremos (outliers) nos dados. Por exemplo, se o valor mais alto no conjunto de dados QI tinha sido 150 em vez de 116, o SD teria ido até 14,4-23,9.
Video: Variância e Desvio Padrão
Várias outras medidas úteis de dispersão estão relacionadas com a DP:
variância: o variação é apenas o quadrado do SD. Para o exemplo de QI, a variância = 14,42 = 207,36.
Coeficiente de variação: o coeficiente de variação (CV) é o SD dividido pela média. Para o exemplo de QI, cv = 14,4 / 98,3 = 0,1465, ou 14,65 por cento.