Gráficos de dispersão: técnica gráfica de dados estatísticos

Ao contrário de um terreno caule e folhas, uma gráfico de dispersão

destina-se a mostrar a relação entre dois variáveis. Pode ser difícil para ver se há uma relação entre duas variáveis ​​só de olhar para os dados brutos, mas com um gráfico de dispersão, quaisquer padrões que existem nos dados tornam-se muito mais fácil de ver.

Um gráfico de dispersão é constituída por uma série de pontos- cada ponto mostra um único valor para duas variáveis ​​diferentes. Por exemplo, você poderia construir um gráfico de dispersão para mostrar a relação entre as receitas anuais da corporação e seus lucros anuais. Se você está tentando prever lucros com base na receita, o eixo X seria usado para mostrar receitas anuais, eo eixo Y seria usado para mostrar lucros anuais. Assim, as receitas são consideradas como a variável independente, e os lucros são considerados a variável dependente neste relacionamento.

Em um gráfico de dispersão, o eixo dos X (isto é, o eixo horizontal) é usada para mostrar o independente variável, e o eixo Y (o eixo vertical) é usada para mostrar o dependente variável.

Neste exemplo, cada ponto no gráfico de dispersão mostra as receitas e vendas para um determinado ano. A tabela mostra a relação entre as receitas anuais e lucros anuais de uma empresa durante os anos de 2004-2014.

As receitas anuais e lucros 2004-2014
AnoReceitas ($ milhões)Lucros ($ milhões)
200422542
200523743
200624548
200722240
200826560
200927056
201025453
201128060
201229062
201330565
201431271

A figura seguinte mostra o gráfico de dispersão resultante.

gráfico de dispersão de receitas e lucros 2004-2014 anuais.
gráfico de dispersão de receitas e lucros 2004-2014 anuais.

Cada ponto no gráfico de dispersão representa as receitas e os lucros relacionados da corporação para um único ano. Por exemplo, o ponto no canto superior direito, canto da trama representa dados para 2014, quando a receita da companhia foi de US $ 312 milhões e os lucros foram de US $ 71 milhões.

Você pode usar um gráfico de dispersão para determinar se

  • As duas variáveis ​​tendem a mover-se na mesma direcção.

    Video: Aula de Estatística - Correlação Linear - Diagrama de Dispersão

  • As duas variáveis ​​tendem a mover-se em sentidos opostos.

    Video: Correlação Linear - Aula 1 - Diagrama de Dispersão

  • As duas variáveis ​​não são relacionados uns aos outros.



Se duas variáveis ​​tendem a se mover na mesma direção, disse que estão a ser positivamente correlated- se eles tendem a mover-se em sentidos opostos, que são referidos como sendo negativamente correlacionados. Se duas variáveis ​​não mostram qualquer padrão particular, disse que estão a ser não correlacionadas.

Esta figura mostra um gráfico de dispersão de duas variáveis ​​(X e Y) que são positivamente correlacionados.

diagrama de dispersão de duas variáveis ​​positivamente correlacionados.

Video: [Excel[ - Tutorial de Gráfico de Dispersão

diagrama de dispersão de duas variáveis ​​positivamente correlacionados.

O gráfico de dispersão que mostra como X aumenta, há uma forte tendência para Y para aumentar (mas não necessariamente na mesma quantidade). Isto mostra que X e Y são positivamente correlacionados.

A figura seguinte mostra o mesmo gráfico de dispersão com um tendência line- a equação desta linha é estimado com análise de regressão.

gráfico de dispersão de duas variáveis ​​positivamente correlacionada com uma linha de tendência.
gráfico de dispersão de duas variáveis ​​positivamente correlacionada com uma linha de tendência.

A linha de tendência mostra a quantidade de alterações Y, em média, dada uma mudança específica no X. Uma linha de tendência de inclinação positiva indica que duas variáveis ​​são positivamente correlated- semelhante, uma linha de tendência de inclinação negativa indica que duas variáveis ​​são negativamente correlacionados. Se uma linha de tendência é plana (isto é, tem uma inclinação zero), isso indica que as duas variáveis ​​estão relacionados entre si. A linha de tendência positivamente inclinada mostra que X e Y são positivamente correlacionados.

A figura a seguir mostra um gráfico de dispersão e a linha de tendência para duas variáveis ​​que são negativamente correlacionados.

gráfico de dispersão de duas variáveis ​​correlacionadas negativamente com uma linha de tendência.
gráfico de dispersão de duas variáveis ​​correlacionadas negativamente com uma linha de tendência.

O gráfico de dispersão que mostra o aumento de x, Y tende a decrease- a linha de tendência tem um negativo declive. Portanto, X e Y são negativamente correlacionados.

A figura a seguir mostra um gráfico de dispersão e a linha de tendência para duas variáveis ​​que são não correlacionadas.

gráfico de dispersão de duas variáveis ​​não correlacionadas com uma linha de tendência.
gráfico de dispersão de duas variáveis ​​não correlacionadas com uma linha de tendência.

O gráfico de dispersão que mostra o aumento de x, Y, por vezes, aumenta e, por vezes, diminui. Não existe um padrão específico para os dados. Os pontos parecem estar aleatoriamente espalhados por todo o diagrama. Como um resultado, a linha de tendência é quase plana, e isto mostra que X e Y são não correlacionadas.

Para um exemplo do mundo real, esta figura mostra um gráfico de dispersão da relação entre o preço das ações da Apple e do Padrão e índice de mercado de 500 ações da pobre de 01 de janeiro de 2013 a 31 de Dezembro de 2013.

Gráfico de dispersão dos preços diários das ações da Apple e do S & amp; P 500.
Gráfico de dispersão dos preços diários das ações da Apple eo S&P 500.

The Standard and Poors 500 (S&P) índice 500 é uma média dos preços dos 500 maiores estoques U.S.. O valor deste índice reflete o estado geral da economia EUA. A trama mostra que há uma correlação positiva entre o preço das ações da Apple eo S&P 500.


Publicações relacionadas