Vá para fora a norma com as estatísticas não paramétricas
Todos os testes estatísticos são derivados com base em algumas suposições sobre seus dados, ea maioria dos testes de significância clássicos (como os testes t de Student, análise de variância e testes de regressão) assumem que os seus dados são distribuídos de acordo com alguma distribuição de frequência clássica ( mais geralmente a distribuição normal).
Conteúdo
Video: Lemmy Kilmister Motorhead 2010 Documentary Greek/Portuguese/Spanish Subtitles
Porque as funções de distribuição clássicos são todos escritos como expressões matemáticas envolvendo parâmetros (como média e desvio padrão), eles são chamados paramétrico funções de distribuição, e testes que assumem os seus dados está em conformidade com uma função de distribuição paramétrica são chamados de testes paramétricos. Uma vez que a distribuição normal é a distribuição estatística mais comum, o termo parumateste métrica é mais frequentemente utilizado para significar um teste que assume dados distribuídos normalmente.
Mas às vezes os dados não é paramétrica. Por exemplo, você pode não querer assumir que os seus dados são normalmente distribuídos, pois pode ser muito visivelmente inclinada, como mostrado na parte uma da figura.
Video: DON'T PANIC — Hans Rosling showing the facts about population
Às vezes, você pode ser capaz de realizar algum tipo de transformação de seus dados para torná-lo mais distribuída normalmente. Por exemplo, muitas variáveis que têm uma distribuição assimétrica pode ser convertido em números normalmente distribuída tendo em logaritmos, como mostrado na parte b. Se, por tentativa e erro, você pode encontrar algum tipo de transformação que normaliza seus dados, você pode executar os testes clássicos sobre os dados transformados.
Mas às vezes os seus dados estão teimosamente anormal, e você não pode usar os testes paramétricos. Felizmente, os estatísticos desenvolveram testes especiais que não assumem normalmente distribuído data- estes são (não surpreendentemente) chamou testes não paramétricos. A maioria dos testes paramétricos clássicos comuns têm contrapartidas não paramétricos.
Como você pode esperar, os testes não paramétricos mais conhecidos e utilizados são aqueles que correspondem aos testes clássicos mais conhecidos e utilizados.
Teste Parametric clássico | equivalente não paramétrico |
---|---|
Um grupo ou emparelhado teste t de Student | Assinar test- Wilcoxon teste assinados-fileiras |
Dois grupos teste t de Student | Wilcoxon soma de fileiras teste-teste Mann-Whitney U |
One-way ANOVA | teste de Kruskal-Wallis |
teste de correlação de Pearson | teste de Correlação Spearman |
A maior parte dos testes não paramétricos envolvem primeiro a triagem seus valores de dados, menor para o maior, e gravar o posto de cada medição (o valor mais baixo tem uma classificação de 1, o próximo valor mais alto uma classificação de 2, e assim por diante). Todos os cálculos subseqüentes são feitas com estas fileiras em vez de com os valores de dados reais.
Embora os testes não paramétricos não assumem normalidade, eles fazem certas suposições sobre seus dados. Por exemplo, muitos testes não paramétricos supor que você não tem quaisquer valores amarrados em seu conjunto de dados (em outras palavras, não há dois temas têm exatamente os mesmos valores). A maioria dos testes paramétricos incorporar ajustes para a presença de laços, mas isso enfraquece o teste e faz com que o resultado não exata.
Mesmo em estatística descritiva, os parâmetros comuns têm contrapartes não-paramétricos. Apesar de médias e desvios-padrão pode ser calculado para qualquer conjunto de números, eles são mais úteis para resumir dados quando os números são normalmente distribuídos. Quando você não sabe como os números são distribuídos, medianas e quartis são muito mais úteis como medidas de tendência central e de dispersão.