Como usar gráficos de quantis para verificar a normalidade dos dados no r

Histogramas deixam muito à interpretação do espectador. A melhor maneira gráfica em R dizer se seus dados são distribuídos normalmente é olhar para um enredo chamado quantil-quantil (QQ).

Com essa técnica, você traça quantiles uns contra os outros. Se você comparar duas amostras, por exemplo, você simplesmente comparar os quantis de ambas as amostras. Ou, para colocá-lo um pouco diferente, R faz o seguinte para construir um enredo QQ:

  • Ele classifica os dados de ambas as amostras.

  • Ele traça estes valores ordenados uns contra os outros.

Se ambas as amostras não contêm o mesmo número de valores, R calcula valores extras por interpolação para o menor de exemplo para criar duas amostras do mesmo tamanho.

Como comparar duas amostras de dados

Claro, você não tem que fazer isso sozinho, você pode simplesmente usar o qqplot () função para isso. Assim, para verificar se as temperaturas durante a atividade e durante o repouso são distribuídos igualmente, basta fazer o seguinte:

gt; qqplot (beaver2 $ temp [beaver2 $ activ == 1], + beaver2 $ temp [beaver2 $ activ == 0])

Isso cria uma trama onde os valores solicitados são plotados contra o outro.



Entre os colchetes, você pode usar um vetor lógico para selecionar os casos que você deseja. Aqui você seleciona todos os casos em que a variável activ é igual a 1 para a primeira amostra, e todos os casos em que a variável é igual a 0 para a segunda amostra.

Como usar um enredo R QQ para verificar a normalidade dos dados

Na maioria dos casos, você não quer comparar duas amostras uns com os outros, mas comparar a amostra com uma amostra teórica que vem de uma certa distribuição (por exemplo, a distribuição normal).

Para fazer uma trama QQ desta forma, R tem o especial qqnorm () função. Como o nome indica, esta função desenha sua amostra contra uma distribuição normal. Você simplesmente dar a amostra que pretende desenhar como um primeiro argumento e adicionar quaisquer parâmetros gráficos que você gosta.

R cria então uma amostra com valores provenientes do padrão distribuição normal, ou uma distribuição normal com uma média de zero e um desvio padrão de uma. Com esta segunda amostra, R cria a trama QQ como explicado antes.

Video: SPSS 19 - Testes de Normalidade

R também tem um qqline () função, o que acrescenta uma linha ao seu plot normal QQ. Esta linha faz com que seja muito mais fácil de avaliar se você vê um claro desvio da normalidade. Quanto mais perto todos os pontos de mentir para a linha, mais próximo a distribuição de sua amostra trata da distribuição normal. o qqline () função também leva a amostra como um argumento.

Agora você quer fazer isso para as temperaturas durante tanto o ativo e o período inactivo do castor. Você pode usar o qqnorm () funcionar duas vezes para criar as duas parcelas. Para os períodos inativos, você pode usar o seguinte código:

Video: 6 Estatística 1 Gráficos Variáveis Qualitativas

gt; qqnorm (beaver2 $ temp [beaver2 $ activ == 0], principal = `Inactivo`) gt; qqline (beaver2 $ temp [beaver2 $ activ == 0])

Você pode fazer o mesmo para o período ativo, alterando o valor 0 para 1.


Publicações relacionadas