3 Principais modelo linear de probabilidade (lpm) problemas
Usando a técnica de mínimos quadrados (OLS) para estimar um modelo com uma variável dependente manequim é conhecida como a criação de um modelo linear de probabilidade,
Conteúdo
Não normalidade do termo de erro
erros heterocedásticos
previsões potencialmente sem sentido
Video: Programacion lineal con 3 variables YARELYS VARGAS
Não normalidade do termo de erro
A suposição de que o erro é normalmente distribuído é fundamental para a realização de testes de hipóteses depois de estimar o modelo econométrico.
O termo de erro de um LPM tem uma distribuição binomial, em vez de uma distribuição normal. Isso implica que o tradicional t-testes de significância individual e F-testes para a importância global são inválidos.
Como você pode ver, o termo de erro em uma LPM tem um dos dois valores possíveis para um determinado X valor. Um valor possível para o erro (se Y = 1) é dada por A, e o outro valor possível para o erro (Se Y = 0) é dada por B. Consequentemente, é impossível para o termo de erro de ter uma distribuição normal.
Heteroskedasticity
O modelo de regressão linear clássico (CLRM) assume que o termo de erro é homocedásticos. A suposição de homocedasticidade é necessário para provar que os estimadores OLS são eficientes (ou melhor). A prova de que MQO estimadores são eficientes é um componente importante do teorema de Gauss-Markov. A presença de heteroskedasticity pode fazer com que o teorema de Gauss-Markov para ser violado e levar a outras características indesejáveis para os estimadores OLS.
O termo de erro em uma LPM é heterocedásticos porque a variância não é constante. Em vez disso, a variância de um termo de erro LPM depende do valor da variável independente (s).
Usando a estrutura da LPM, você pode caracterizar a variação de seu termo de erro da seguinte forma
Porque a variância do erro depende do valor de X, exibe heteroskedasticity em vez de homocedasticidade.
probabilidades previstas ilimitados
A lei probabilidade mais básico afirma que a probabilidade de um evento ocorrer deve ser contido dentro do intervalo [0,1]. Mas a natureza de um LPM é tal que não garante esta lei fundamental da probabilidade é satisfeito. Embora a maioria das probabilidades previstas a partir de um LPM têm valores sensíveis (entre 0 e 1), algumas probabilidades previstas podem ter valores sem sentido que são menos do que 0 ou maior do que 1.
Dê uma olhada na figura a seguir e focar sua atenção sobre os segmentos da linha de regressão, onde a probabilidade condicional é maior do que 1 ou inferior a 0. Quando a variável dependente é contínua, você não precisa se preocupar com valores ilimitados para o meios condicionais. No entanto, variáveis dicotômicas são problemáticas porque os meios condicionais representam probabilidades condicionais. Interpretação probabilidades que não são delimitadas por 0 e 1 é difícil.
Você pode ver um exemplo desse problema com dados reais:
A maioria das probabilidades estimadas a partir da estimativa LPM estão contidos no intervalo [0,1], mas a probabilidade prevista para o sétimo observação é negativo. Infelizmente, nada na estimativa de um LPM assegura que todas as probabilidades previstas ficar dentro de valores razoáveis.