Eda técnicas para testar as suposições

Existem várias técnicas de análise exploratória de dados (EDA) que você pode usar para testar hipóteses sobre um conjunto de dados. Estes incluem trama sequência de correr, retardação trama, histograma, e gráfico de probabilidade normal.

trama sequência executar

Muitas técnicas de estatística baseiam-se no pressuposto de que os dados que estão sendo analisados ​​tem as seguintes propriedades:

  • Variáveis ​​independentes

  • Variáveis ​​desenhadas a partir de uma distribuição de probabilidade comum

  • As variáveis ​​com parâmetros comuns (por exemplo, média e desvio padrão)

UMA trama sequência executar testa se os dados está em conformidade com estes pressupostos. Por exemplo, a figura a seguir mostra um gráfico seqüência de funcionamento para os retornos diários para a Standard and Poor índice do mercado de ações.

trama sequência de correr de retornos diários para o amp; S & P 500.
trama sequência de correr de retornos diários para o S&P 500.

Porque este é um gráfico de séries temporais, ele está sendo usado para determinar se os retornos do S&P 500 são independentes um do outro, se todos eles são retirados da mesma distribuição de probabilidade, e se os parâmetros (média e variância) permanecer constante ao longo do tempo.

O enredo seqüência de execução é projetado para responder a estas perguntas:

  • Há alguma alteração na média dos dados?

  • Há alguma mudança na variância dos dados?

    Video: Teste do Capacitor Eletrolítico - Como usar o Capacímetro, como testar capacitor Parte II

Além disso, você usa o enredo seqüência prazo para identificar os valores atípicos nos dados.

A trama dos retornos para o S&P 500 mostra que a média e variância dos dados permanecem estáveis ​​ao longo do tempo, e que há não parecem ser quaisquer valores aberrantes.

enredo lag

UMA enredo lag determina se os elementos de um conjunto de dados são aleatória (Independentes uns dos outros). Em outras palavras, a trama mostra se há ou não um padrão nos dados. Padrões nos dados são inconsistentes com a aleatoriedade.



Um valor desfasado é um que ocorreu no passado. Um desfasamento de 1 refere-se a uma observação de que teve lugar um período no passado. Um atraso de 2 refere-se a uma observação de que teve lugar dois períodos no passado, e assim por diante.

Uma trama de atraso mostra os valores de uma variável no eixo vertical, e os valores da mesma variável desfasada no eixo horizontal. Por exemplo, esta figura mostra um gráfico lag para os retornos diários para a Standard and Poor índice do mercado de ações.

Video: Capacitor, Como Testar e Interpretar a Capacitância

enredo Lag dos retornos diários para a Standard and Poor`s 500 in 2013.
Lag lote de retornos diários para a Standard and Poor de 500 em 2013.

Os pontos nesta trama estão espalhados aleatoriamente sem um padrão particular. Isto é consistente com a suposição de aleatoriedade nos dados.

histograma

Você pode usar um histograma para identificar a distribuição seguido de um conjunto de dados. Um histograma pode mostrar vários detalhes importantes sobre um conjunto de dados, incluindo o seguinte:

  • O centro de dados

  • A propagação (variabilidade) dos dados

  • A assimetria dos dados (se houver)

  • A presença de outliers

Por exemplo, esta figura mostra um histograma para os retornos diários para a Standard and Poor índice do mercado de ações.

Histograma de resultados diários para o amp; S & P 500.
Histograma de resultados diários para o S&P 500.

Video: Multimetro Digital com teste de capacimetro e temperatura

O gráfico mostra que os retornos da Standard and Poor têm uma média de aproximadamente 0 - as alturas das barras são maiores perto 0. Os retornos parecem apresentar assimetria negativa (Isto é, retornos negativos extremos são mais comuns do que retornos positivos extremos) e têm uma maior magnitude. Há não parecem ser os valores atípicos nos dados.

gráfico de probabilidade normal

Use um gráfico de probabilidade normal para comparar um conjunto de dados para a distribuição normal. O eixo vertical deste gráfico mostra os quantis do conjunto de dados, e o eixo horizontal mostra os percentis da distribuição normal. Se um conjunto de dados é normalmente distribuída, então o gráfico deve parecer uma linha reta com uma inclinação de 1.

Quantis são usados ​​para dividir um conjunto de dados em grupos de igual tamanho. Um tipo amplamente utilizado de quantil é a quartil, que (como discutido anteriormente) divide um conjunto de dados em quatro grupos iguais, cada um consistindo em 25 por cento dos dados. Outra opção popular é o percentil, que divide um conjunto de dados em cem grupos iguais, cada uma consistindo de 1 por cento dos dados.

A figura a seguir mostra um gráfico de probabilidade normal para os retornos diários para a Standard and Poor índice do mercado de ações.

Video: Teste de Transistor do tipo MOSFET com multímetro digital

gráfico de probabilidade normal dos retornos diários para o amp; S & P 500 em 2013.
gráfico de probabilidade normal dos retornos diários para o S&P 500 em 2013.

O gráfico mostra que o retorno para o S&P 500 são perto de ser normal, com desvios nas caudas da distribuição.


Publicações relacionadas