Como dados estatísticos grupo apropriadamente em um histograma
Quando você cria um histograma, é importante para agrupar os conjuntos de dados em intervalos que permitem ver padrões significativos em seus dados estatísticos. Por exemplo, digamos que você quer ver se atrizes que ganharam um Oscar eram susceptíveis de ser dentro de uma determinada faixa etária.
Conteúdo
A imagem seguinte mostra um histograma de idades Melhores vencedores Atriz Prêmio da Academia entre 1928 e 2009.
Video: ESTATÍSTICA; HISTOGRAMA POLÍGONO DE FREQUÊNCIA
Esta imagem mostra grupos de 5 anos cada um, porque incrementos de 5 criar pausas naturais para os anos e porque fornece bares suficientes para procurar padrões gerais. Por exemplo, você pode ver que a maioria dos vencedores, cerca de 68 por cento, estavam entre as idades de 25 e 40, com um pico definido entre as idades de 30 e 35.
Tenha em mente que você não tem para usar esta grouping- particular que você tem um pouco de flexibilidade ao fazer um histograma. Aqui estão algumas dicas úteis:
Video: Estatística - Questão 4 - Histograma e Polígono de Frequências
Cada conjunto de dados requer várias categorias para os seus agrupamentos, mas você quer evitar faixas que são muito larga ou muito estreita.
Video: Histograma
Se um histograma tem gamas muito amplas para seus grupos, ele coloca todos os dados em um número muito pequeno de bares que fazem comparações significativas impossível.
Se o histograma tem intervalos muito estreitos para seus grupos, parece que uma grande série de pequenos bares que obscurecem a imagem grande. Isso pode tornar os dados parecem muito agitado com nenhum padrão real.
Certifique-se de seus grupos têm larguras iguais. Se uma barra é mais largo do que os outros, pode conter mais dados do que deveria.
Uma solução que pode ser apropriado para o seu histograma é levar o intervalo de dados (maior menos menor) e dividir por 10 para obter 10 agrupamentos.
E se um vencedor é de 30 anos de idade? Será que ela pertencem em 25-30 ou 30-35? Contanto que você é consistente com todos os pontos de dados, você pode colocar todos os pontos de fronteira em suas respectivas barras inferiores ou colocar todos eles em suas respectivas barras superiores. O importante é escolher uma direção e ser consistente. É prática comum para fazer os intervalos de barras deixou inclusiva (Isto é, as barras de incluir o ponto final esquerdo, mas não o direito).