3 Principais modelo linear de probabilidade (lpm) problemas

Usando a técnica de mínimos quadrados (OLS) para estimar um modelo com uma variável dependente manequim é conhecida como a criação de um modelo linear de probabilidade,

ou LPM. LPMs não são perfeitos. Três problemas específicos podem surgir:

  • Não normalidade do termo de erro

  • erros heterocedásticos

  • previsões potencialmente sem sentido

    Video: Programacion lineal con 3 variables YARELYS VARGAS

Não normalidade do termo de erro

A suposição de que o erro é normalmente distribuído é fundamental para a realização de testes de hipóteses depois de estimar o modelo econométrico.

O termo de erro de um LPM tem uma distribuição binomial, em vez de uma distribuição normal. Isso implica que o tradicional t-testes de significância individual e F-testes para a importância global são inválidos.

Como você pode ver, o termo de erro em uma LPM tem um dos dois valores possíveis para um determinado X valor. Um valor possível para o erro (se Y = 1) é dada por A, e o outro valor possível para o erro (Se Y = 0) é dada por B. Consequentemente, é impossível para o termo de erro de ter uma distribuição normal.

Heteroskedasticity

O modelo de regressão linear clássico (CLRM) assume que o termo de erro é homocedásticos. A suposição de homocedasticidade é necessário para provar que os estimadores OLS são eficientes (ou melhor). A prova de que MQO estimadores são eficientes é um componente importante do teorema de Gauss-Markov. A presença de heteroskedasticity pode fazer com que o teorema de Gauss-Markov para ser violado e levar a outras características indesejáveis ​​para os estimadores OLS.



O termo de erro em uma LPM é heterocedásticos porque a variância não é constante. Em vez disso, a variância de um termo de erro LPM depende do valor da variável independente (s).

Usando a estrutura da LPM, você pode caracterizar a variação de seu termo de erro da seguinte forma

Porque a variância do erro depende do valor de X, exibe heteroskedasticity em vez de homocedasticidade.

probabilidades previstas ilimitados

A lei probabilidade mais básico afirma que a probabilidade de um evento ocorrer deve ser contido dentro do intervalo [0,1]. Mas a natureza de um LPM é tal que não garante esta lei fundamental da probabilidade é satisfeito. Embora a maioria das probabilidades previstas a partir de um LPM têm valores sensíveis (entre 0 e 1), algumas probabilidades previstas podem ter valores sem sentido que são menos do que 0 ou maior do que 1.

Dê uma olhada na figura a seguir e focar sua atenção sobre os segmentos da linha de regressão, onde a probabilidade condicional é maior do que 1 ou inferior a 0. Quando a variável dependente é contínua, você não precisa se preocupar com valores ilimitados para o meios condicionais. No entanto, variáveis ​​dicotômicas são problemáticas porque os meios condicionais representam probabilidades condicionais. Interpretação probabilidades que não são delimitadas por 0 e 1 é difícil.

Você pode ver um exemplo desse problema com dados reais:

A maioria das probabilidades estimadas a partir da estimativa LPM estão contidos no intervalo [0,1], mas a probabilidade prevista para o sétimo observação é negativo. Infelizmente, nada na estimativa de um LPM assegura que todas as probabilidades previstas ficar dentro de valores razoáveis.


Publicações relacionadas