Como interpretar um gráfico de dispersão

Scatterplots são úteis para a interpretação de tendências em dados estatísticos. Cada observação (ou ponto) em uma dispersão tem duas coordinates- os primeiro corresponde à primeira parte de dados no par (que é a X coordinate- a quantidade que você vá para a esquerda ou direita). A segunda coordenada corresponde ao segundo segmento de dados no par (que é a Y-coordinate- a quantidade que você ir para cima ou para baixo). O ponto que representa essa observação é colocado no ponto de intersecção das duas coordenadas.

Dispersão da temperatura exterior em relação ao silvos de críquete.
Dispersão da temperatura exterior em relação ao silvos de críquete.

Video: Gráfico de Dispersão (ou correlação)

A figura acima mostra um gráfico de dispersão para a temperatura e grilos dados listados na tabela a seguir.

Dados de temperatura e grilos (extracto)
Temperatura (Fahrenheit)Número de Chirps (em 15 segundos)
5718
6020
6421
6523
6827
7130
7434
7739

Como os dados são ordenados de acordo com sua X-valores, os pontos no gráfico de dispersão de correspondência a partir da esquerda para a direita com as observações apresentadas na tabela, na ordem listada.

Você interpretar um gráfico de dispersão, olhando para as tendências nos dados como você vai da esquerda para a direita:

  • Se os dados mostram um padrão de subida como você se move da esquerda para a direita, isto indica uma relação positiva entre X e Y. Enquanto o X-Valores de aumento (mover para a direita), a Y-valores tendem a aumentar (mover para cima).

  • Se os dados mostram um padrão de descida como você se move da esquerda para a direita, isto indica uma relação negativa entre X e Y. Enquanto o X-valores aumentar (mover para a direita) o Y-valores tendem a diminuir (mover para baixo).



  • Se os dados não parecem assemelhar-se a qualquer tipo de padrão (mesmo um vago um), então não existe nenhuma relação entre X e Y.

Um padrão de especial interesse é um linear teste padrão, onde os dados tem uma aparência geral de uma linha que vai subidas ou descidas. Olhando para a figura anterior, você pode ver que uma relação linear positiva parece entre a temperatura eo número de silvos de críquete. Isto é, quando a temperatura aumenta, o número de grilos aumenta também. Note-se que o diagrama de dispersão única sugere uma relação linear entre os dois conjuntos de valores. ele faz não sugerem que um aumento na temperatura causas o número de grilos a aumentar.

UMA relação linear entre X e Y existe quando o padrão de X- e Y-valores se assemelha a uma linha, ou a subir (com uma inclinação positiva) ou em declive (com uma inclinação negativa).

Scatterplots mostrar possíveis associações ou relações entre duas variáveis. No entanto, só porque o seu gráfico ou tabela mostra algo está acontecendo, isso não significa que existe uma relação de causa e efeito.

Por exemplo, um médico observa que as pessoas que tomam vitamina C todos os dias parecem ter menos resfriados. Será que isso significa vitamina C previne resfriados? Não necessariamente. Pode ser que as pessoas que estão mais conscientes da saúde tomar vitamina C todos os dias, mas eles também comem mais saudável, não está acima do peso, exercer todos os dias, e lavar as mãos com mais frequência. Se este médico realmente quer saber se é a vitamina C que está fazendo isso, ela precisa de um experimento bem concebido que exclui esses outros fatores.


Publicações relacionadas