Como interpretar um gráfico de dispersão
Scatterplots são úteis para a interpretação de tendências em dados estatísticos. Cada observação (ou ponto) em uma dispersão tem duas coordinates- os primeiro corresponde à primeira parte de dados no par (que é a X coordinate- a quantidade que você vá para a esquerda ou direita). A segunda coordenada corresponde ao segundo segmento de dados no par (que é a Y-coordinate- a quantidade que você ir para cima ou para baixo). O ponto que representa essa observação é colocado no ponto de intersecção das duas coordenadas.
Video: Gráfico de Dispersão (ou correlação)
A figura acima mostra um gráfico de dispersão para a temperatura e grilos dados listados na tabela a seguir.
Dados de temperatura e grilos (extracto) | |
Temperatura (Fahrenheit) | Número de Chirps (em 15 segundos) |
---|---|
57 | 18 |
60 | 20 |
64 | 21 |
65 | 23 |
68 | 27 |
71 | 30 |
74 | 34 |
77 | 39 |
Como os dados são ordenados de acordo com sua X-valores, os pontos no gráfico de dispersão de correspondência a partir da esquerda para a direita com as observações apresentadas na tabela, na ordem listada.
Você interpretar um gráfico de dispersão, olhando para as tendências nos dados como você vai da esquerda para a direita:
Se os dados mostram um padrão de subida como você se move da esquerda para a direita, isto indica uma relação positiva entre X e Y. Enquanto o X-Valores de aumento (mover para a direita), a Y-valores tendem a aumentar (mover para cima).
Se os dados mostram um padrão de descida como você se move da esquerda para a direita, isto indica uma relação negativa entre X e Y. Enquanto o X-valores aumentar (mover para a direita) o Y-valores tendem a diminuir (mover para baixo).
Se os dados não parecem assemelhar-se a qualquer tipo de padrão (mesmo um vago um), então não existe nenhuma relação entre X e Y.
Um padrão de especial interesse é um linear teste padrão, onde os dados tem uma aparência geral de uma linha que vai subidas ou descidas. Olhando para a figura anterior, você pode ver que uma relação linear positiva parece entre a temperatura eo número de silvos de críquete. Isto é, quando a temperatura aumenta, o número de grilos aumenta também. Note-se que o diagrama de dispersão única sugere uma relação linear entre os dois conjuntos de valores. ele faz não sugerem que um aumento na temperatura causas o número de grilos a aumentar.
UMA relação linear entre X e Y existe quando o padrão de X- e Y-valores se assemelha a uma linha, ou a subir (com uma inclinação positiva) ou em declive (com uma inclinação negativa).
Scatterplots mostrar possíveis associações ou relações entre duas variáveis. No entanto, só porque o seu gráfico ou tabela mostra algo está acontecendo, isso não significa que existe uma relação de causa e efeito.
Por exemplo, um médico observa que as pessoas que tomam vitamina C todos os dias parecem ter menos resfriados. Será que isso significa vitamina C previne resfriados? Não necessariamente. Pode ser que as pessoas que estão mais conscientes da saúde tomar vitamina C todos os dias, mas eles também comem mais saudável, não está acima do peso, exercer todos os dias, e lavar as mãos com mais frequência. Se este médico realmente quer saber se é a vitamina C que está fazendo isso, ela precisa de um experimento bem concebido que exclui esses outros fatores.