Os testes de hipóteses para valores extremos de dados

Vários testes estatísticos formais que são projetados para detectar valores atípicos de dados. Três destes assumir a forma de testes de hipóteses. Um teste de hipótese é um procedimento para determinar se uma proposta pode ser rejeitada com base em dados de exemplo. Os testes de hipóteses envolvem sempre comparando uma estatística de teste a partir dos dados para uma distribuição adequada para determinar se uma dada hipótese é suportada pelos dados.

teste de Grubbs

Com um teste de Grubbs, você assumir que o conjunto de dados que está sendo testado para os outliers é normalmente distribuída. As hipóteses nulas e alternativas são como se segue:

H0: Não existem valores discrepantes.

H1: Há pelo menos um outlier.

A estatística de teste é como se segue:

Onde

G = A estatística de teste para o teste de Grubbs

Yi = Um único elemento no conjunto de dados a ser testada

Y = A média de amostras

s = O desvio padrão da amostra

A estatística de teste produz o elemento da amostra que está mais afastada da média da amostra (positivo ou negativo) expressos como desvios padrão. Por exemplo, se a média da amostra é 5, o maior elemento de amostra é 11, e o desvio padrão da amostra é 2, então a estatística de teste seria (11 - 5) / 2 = 6/2 = 3 desvios padrão de distância da média .

O valor crítico é a seguinte:

Onde

n é o tamanho da amostra retirada da população.

t é um valor retirado do t de Student Distribuição por isso tem uma área de cauda direita igual ao nível de significância e n - 2 graus de liberdade (df).

O teste pode ser realizado para determinar se existe um outlier, se o valor máximo é um outlier, se o valor mínimo é um valor aberrante, e assim por diante.

Por exemplo, a seguir apresenta os resultados da aplicação do teste de Grubbs para o S&P 500 retorna de 2009-2013. O teste é realizado para encontrar um único outlier. os resultados do teste de Grubbs para um outlier:

Dados: SPReturns

L = 3,8509, L = 0,9404, p = 0,01177

Video: Teste de Hipóteses em Análise Estatística

hipótese alternativa: O mais baixo valor -,0253283545257448 é um outlier

Com um nível de significância igual a 0,05, e um valor de p de 0,01177, o valor de p está abaixo do nível de significância. Portanto, a hipótese nula de não discrepantes é rejeitada. Além disso, o ensaio indica que o valor mínimo no conjunto de dados é um valor aberrante.

teste do qui-quadrado



Você pode testar para valores discrepantes com a distribuição qui-quadrado. As hipóteses nulas e alternativas são como se segue:

Video: O que são Testes de Hipótese? - Bioestatística #9

H0: Não existem valores discrepantes.

H1: Há pelo menos um outlier.

A estatística de teste baseia-se nas diferenças entre os membros do conjunto de dados reais de um e os membros correspondentes de uma distribuição de probabilidade assumida, tais como o normal.

Por exemplo, a seguir apresenta os resultados da aplicação do teste de qui-quadrado para o S&P 500 retorna de 2009-2013:

teste do qui-quadrado para outlier

Dados: SPReturns

X-quadrado = 14,8292, p-valor = 0,01177

hipótese alternativa: O mais baixo valor -,0253283545257448 é um outlier

Com um nível de significância igual a 0,05, e um valor de p de 0,01177, o valor de p está abaixo do nível de significância. Portanto, a hipótese nula de não discrepantes é rejeitada. Além disso, o ensaio indica que o valor mínimo no conjunto de dados é um valor aberrante.

teste Q de Dixon

Com teste Q de Dixon, você assume o conjunto de dados que está sendo testado para os outliers é normalmente distribuída. As hipóteses nulas e alternativas são como se segue:

H0: Não existem valores discrepantes.

Video: Estatística - Aula 22 - Exercícios sobre Teste de Hipóteses para Média

H1: Há pelo menos um outlier.

A estatística de teste é como se segue:

lacuna refere-se ao valor absoluto da diferença entre um valor aberrante e o próximo valor mais próximo do conjunto de dados. Alcance refere-se à diferença entre o maior valor no conjunto de dados e o menor valor no conjunto de dados.

Uma das desvantagens para teste Q de Dixon é que você pode aplicá-lo apenas a uma amostra contendo entre 3 e 30 observações.

A seguir mostra os resultados da aplicação do teste Q de Dixon ao S&P 500 retornos durante os primeiros 30 dias de negociação de 2009:

teste de Dixon para os outliers

Dados: SPR

Q = 0,4359, p = 0,03185

Video: Resolução #3 - Estatística - Teste de Hipóteses - Poder do Teste

hipótese alternativa: O mais baixo valor -,0116057775514049 é um outlier

Com um nível de significância igual a 0,05, e um valor de p de 0,03185, o valor de p está abaixo do nível de significância. Portanto, a hipótese nula de não discrepantes é rejeitada. Além disso, o ensaio indica que o valor mínimo no conjunto de dados é um valor aberrante.


Publicações relacionadas