Histogramas: técnica gráfica de dados estatísticos

Video: Estatística #9: Gráficos Estatísticos - Histograma

UMA histograma é um gráfico que representa a distribuição de probabilidade de um conjunto de dados. Um histograma tem uma série de barras verticais, onde cada barra representa um único valor ou uma gama de valores de uma variável. As alturas das barras indicam as frequências ou probabilidades para os diferentes valores ou intervalos de valores.

Por exemplo, esta figura mostra um histograma dos preços diários das ações da Apple a partir de 01 de janeiro de 2013 a 31 de Dezembro de 2013.

Histograma de preços diárias para as ações da Apple.
Histograma de preços diárias para as ações da Apple.

De acordo com este histograma, a maioria dos preços foram entre US $ 60 e US $ 65 o preço era nesta faixa de 81 vezes durante o ano. Os segundos preços mais frequentemente observadas foram entre US $ 55 e US $ 60 o preço desembarcou nesta faixa de 44 vezes durante o ano. O terceiro intervalo mais frequente de preços foi entre $ 65 e $ 70, e o quarto intervalo mais frequente de preços foi entre $ 70 a $ 75 anos. Muito poucas preços foram entre US $ 50 e US $ 55, e o menor número de preços observados durante o ano foram entre US $ 80 e US $ 85.

Com base no gráfico, a média e de preço médio estavam perto da gama $ 60 a $ 65 anos. A média real foi de US $ 65,67, ea mediana real foi de US $ 63,65. Desde a média excede a mediana, a distribuição de preços para 2013 foi positivamente enviesada. Isto indica que a probabilidade de um preço extremamente grande é um pouco maior do que a probabilidade de um preço extremamente baixo.

A distribuição é positivamente inclinada se a média é maior do que o median- é inclinada negativamente se a média é inferior à mediana. A distribuição é simétrica em torno da média se a média é igual à mediana. Quanto os dados são distorcidos depende de quão longe a média ea mediana diferem. Se eles estão muito perto, às vezes é prático para tratar a distribuição como simétrica.



Como outro exemplo, esta figura mostra um histograma dos preços diárias do S&P 500 índice de ações a partir de 01 de janeiro de 2013 a 31 de Dezembro de 2013.

Histograma de preços diárias para o amplificador S &; P 500.
Histograma de preços diários para o S&P 500.

De acordo com o histograma na Figura 12-10, a gama mais frequentemente observada dos preços durante o ano era entre US $ 1.650 e US $ 1.700. A média acabou por ser de US $ 1,643.80, ea mediana foi de US $ 1,650.41. Ao contrário de ações da Apple, a média foi de abaixo o median- a distribuição de preços para 2013 é inclinada negativamente. Isso indica que houve uma tendência ligeiramente maior para a Standard and Poor de 500 para o comércio abaixo da média do que acima da média em 2013.

Um dos usos mais importantes de histogramas é determinar se um conjunto de dados segue uma distribuição de probabilidades especificado. Embora existam muitos testes estatísticos formais para determinar qual distribuição de probabilidade de um conjunto de dados segue, é boa prática para inspecionar visualmente os dados com um gráfico antes de se envolver em quaisquer testes estatísticos formais.

O histograma de preços da Apple fornece fortes evidências de que os preços das ações da Apple são não distribuído normalmente. A distribuição normal é simétrico sobre sua média, enquanto que os preços das ações da Apple estão positivamente inclinada. O histograma de S&preços P fornece fortes evidências de que o S&P 500 é também pouco provável que seja normalmente distribuído porque a sua distribuição é desviada negativamente.

Video: Estatística - Questão 4 - Histograma e Polígono de Frequências

testes estatísticos formais seriam necessários para mostrar que nem a distribuição é normal, mas os gráficos são altamente sugestivos. Porque muitos testes estatísticos são baseados na suposição de normalidade, é importante para determinar se uma distribuição é verdadeiramente normal, antes de usar qualquer um desses testes.


Publicações relacionadas