Análise exploratória de dados quantitativa técnicas (eda)
Embora EDA é baseado principalmente em técnicas gráficas, também consiste de algumas técnicas quantitativas. Este artigo discute duas delas: a estimativa do intervalo e teste de hipóteses.
Conteúdo
estimativa de intervalo
estimativa de intervalo é uma técnica que é utilizada para construir um alcance de valores dentro do qual uma variável é provável cair. Um exemplo importante disto é o intervalo de confiança. UMA intervalo de confiança é uma gama de números que é susceptível de conter o valor de uma medida de população, tais como a média. Um intervalo de confiança é construído da seguinte forma:
O intervalo de confiança é composto por uma limite inferior igual à estimativa do ponto menos a margem de erro, e um limite superior igual à estimativa do ponto mais a margem de erro.
o estimativa pontual é um único valor estimado a partir de uma amostra. Por exemplo, a média da amostra é uma estimativa do ponto da média da população. Do mesmo modo, o desvio padrão da amostra é uma estimativa do ponto do desvio padrão da população.
A margem de erro reflete a quantidade de incerteza associada à estimativa pontual. Em outras palavras, isso mostra o quanto a estimativa pontual pode mudar de uma amostra para a próxima. A margem de erro é baseado no desvio padrão e o tamanho da amostra a ser utilizado. O resultado destes cálculos é uma gama de valores que é susceptível de conter o verdadeiro valor da medida de população.
Video: Estatística Descritiva: Tipos de Variáveis
Por exemplo, suponhamos que um investigador que determina com 95 por cento de confiança, o intervalo (-2,0 por cento, 8,0 por cento) contém o verdadeiro valor do retorno significativo para o S&P 500 no próximo ano. A média da amostra é a média do limite superior e inferior desse intervalo (isto é, 3,0 por cento). A margem de erro é portanto de 5 por cento.
Testando hipóteses
UMA hipótese estatística é uma declaração de que é suposto ser verdadeiro a menos que haja fortes evidências contraditórias. teste de hipóteses é amplamente utilizado em muitas disciplinas para determinar se uma proposição é verdadeira ou falsa. Por exemplo, testes de hipóteses poderia ser utilizado para determinar se
A idade média dos residentes de um estado é de 43 anos de idade.
O retorno médio para os estoques em um portfólio é de 7,2 por cento.
A quantidade de precipitação anual em uma cidade segue a distribuição normal.
testes de hipóteses é um processo multi-passo que consiste no seguinte:
A declaração da hipótese nula: Esta é a afirmação de que é assumido para ser verdade.
A declaração da hipótese alternativa: Esta é a afirmação de que será aceite se a hipótese nula é rejeitada.
O nível de significância no qual o teste de hipótese será realizado: Este é igual a probabilidade de rejeitar a hipótese nula quando ela é falsa.
Video: Analise Dados qualitativos Parte I
A estatística de teste: Esta é uma medida numérica que mostra se os dados da amostra é consistente com a hipótese nula.
O valor crítico: Se a estatística de teste é mais extremo do que o valor crítico, a hipótese nula é rejeitada.
A decisão: Com base na relação entre a estatística de teste e o valor crítico, de tomar uma decisão sobre se ou não a hipótese nula deve ser rejeitada.