Como selecionar as variáveis independentes para o seu modelo econométrico
Uma das decisões mais importantes que você faz quando especificar o seu modelo econométrico é que as variáveis para incluir como variáveis independentes. Aqui, você descobrir o que problemas podem ocorrer se você incluir muito poucas ou muitas variáveis independentes no seu modelo, e você ver como isso misspecification afeta seus resultados.
Conteúdo
Omitindo variáveis relevantes
Se uma variável que pertence no modelo está excluída a partir da função de regressão estimados, o modelo é mal especificado e pode causar viés nos coeficientes estimados.
Você tem um viés de variável omitida se uma variável excluídos tem algum efeito (positivo ou negativo) sobre a variável dependente e está correlacionada com pelo menos uma das suas variáveis independentes.
A natureza matemática de viés de especificação podem ser expressos utilizando um modelo simples. Suponha que o modelo populacional verdade é dada por
Onde X1 e X2 são as duas variáveis que afetam Y. Mas, devido à ignorância ou falta de dados, em vez disso você estimar essa regressão:
Video: Is Most Published Research Wrong?
que omite X2 a partir das variáveis independentes. O valor esperado
nesta situação é
Mas esta equação viola o teorema de Gauss-Markov porque
A grandeza da polarização pode ser expressa como
Onde
se o efeito de X2 em Y e
é a inclinação desta regressão:
que capta a correlação (positiva ou negativa) entre a variável (s) incluído e excluído.
Impacto da variável omitida sobre Variável Dependente | Correlação entre variável incluída e omitido: | |
---|---|---|
Positivo | Negativo | |
Positivo | viés positivo | viés negativo |
Negativo | viés negativo | viés positivo |
Na prática, é provável que você tem algum viés de variável omitida porque é impossível controlar tudo o que afeta sua variável dependente. No entanto, você pode aumentar suas chances de minimizar viés de variável omitida, evitando modelos de regressão simples (com uma variável independente) e incluindo as variáveis que possam vir a ser o mais importante, teoricamente (e, possivelmente, mas não necessariamente estatisticamente) para explicar a variável dependente .
A inclusão de variáveis irrelevantes
Se uma variável não pertence no modelo e está incluído na função de regressão estimado, o modelo é overspecified. Se você overspecify o modelo de regressão através da inclusão de uma variável irrelevante, os coeficientes estimados permanecer imparcial. No entanto, ele tem um efeito indesejável de aumentar os erros padrão de seus coeficientes.
Em um modelo de regressão simples (com uma variável independente), o erro padrão estimado do coeficiente de regressão para X é
Onde
é a variância estimada do erro e
é a variação total de X.
Se você incluir variáveis independentes adicionais no modelo, o erro padrão estimado para qualquer coeficiente de regressão é dada por
Onde
é o R-quadrado da regressão de Xk nas outras variáveis independentes ou Xs. Porque
Video: Regressão Linear e estatísticas descritivas utilizando o Eviews - Aula 1 | Conteúdo e economia
o numerador diminui. Uma variável irrelevante não ajudar a explicar qualquer da variação Y, assim, sem um decréscimo na compensação
o padrão de erro aumenta.
Só porque o seu coeficiente estimado não é estatisticamente significativa não torná-lo irrelevante. Um modelo bem especificado geralmente inclui algumas variáveis que são estatisticamente significativos e algumas que não são. Além disso, variáveis que não são estatisticamente significativos pode contribuir variação explicada suficiente para ter qualquer impacto negativo sobre os erros padrão.