Como selecionar as variáveis ​​independentes para o seu modelo econométrico

Uma das decisões mais importantes que você faz quando especificar o seu modelo econométrico é que as variáveis ​​para incluir como variáveis ​​independentes. Aqui, você descobrir o que problemas podem ocorrer se você incluir muito poucas ou muitas variáveis ​​independentes no seu modelo, e você ver como isso misspecification afeta seus resultados.

Omitindo variáveis ​​relevantes

Se uma variável que pertence no modelo está excluída a partir da função de regressão estimados, o modelo é mal especificado e pode causar viés nos coeficientes estimados.

Você tem um viés de variável omitida se uma variável excluídos tem algum efeito (positivo ou negativo) sobre a variável dependente e está correlacionada com pelo menos uma das suas variáveis ​​independentes.

A natureza matemática de viés de especificação podem ser expressos utilizando um modelo simples. Suponha que o modelo populacional verdade é dada por

Onde X1 e X2 são as duas variáveis ​​que afetam Y. Mas, devido à ignorância ou falta de dados, em vez disso você estimar essa regressão:

Video: Is Most Published Research Wrong?

que omite X2 a partir das variáveis ​​independentes. O valor esperado

nesta situação é

Mas esta equação viola o teorema de Gauss-Markov porque

A grandeza da polarização pode ser expressa como

Onde

se o efeito de X2 em Y e

é a inclinação desta regressão:



que capta a correlação (positiva ou negativa) entre a variável (s) incluído e excluído.

Resumo de Bias variável omitida
Impacto da variável omitida sobre Variável DependenteCorrelação entre variável incluída e omitido:
PositivoNegativo
Positivoviés positivoviés negativo
Negativoviés negativoviés positivo

Na prática, é provável que você tem algum viés de variável omitida porque é impossível controlar tudo o que afeta sua variável dependente. No entanto, você pode aumentar suas chances de minimizar viés de variável omitida, evitando modelos de regressão simples (com uma variável independente) e incluindo as variáveis ​​que possam vir a ser o mais importante, teoricamente (e, possivelmente, mas não necessariamente estatisticamente) para explicar a variável dependente .

A inclusão de variáveis ​​irrelevantes

Se uma variável não pertence no modelo e está incluído na função de regressão estimado, o modelo é overspecified. Se você overspecify o modelo de regressão através da inclusão de uma variável irrelevante, os coeficientes estimados permanecer imparcial. No entanto, ele tem um efeito indesejável de aumentar os erros padrão de seus coeficientes.

Em um modelo de regressão simples (com uma variável independente), o erro padrão estimado do coeficiente de regressão para X é

Onde

é a variância estimada do erro e

é a variação total de X.

Se você incluir variáveis ​​independentes adicionais no modelo, o erro padrão estimado para qualquer coeficiente de regressão é dada por

Onde

é o R-quadrado da regressão de Xk nas outras variáveis ​​independentes ou Xs. Porque

Video: Regressão Linear e estatísticas descritivas utilizando o Eviews - Aula 1 | Conteúdo e economia

o numerador diminui. Uma variável irrelevante não ajudar a explicar qualquer da variação Y, assim, sem um decréscimo na compensação

o padrão de erro aumenta.

Só porque o seu coeficiente estimado não é estatisticamente significativa não torná-lo irrelevante. Um modelo bem especificado geralmente inclui algumas variáveis ​​que são estatisticamente significativos e algumas que não são. Além disso, variáveis ​​que não são estatisticamente significativos pode contribuir variação explicada suficiente para ter qualquer impacto negativo sobre os erros padrão.


Publicações relacionadas