Especificando funções não-lineares apropriados: os modelos probit e logit
Se o seu desfecho de interesse é qualitativa, você usa uma variável dependente manequim e estimar a probabilidade de que o resultado (Y
Conteúdo
O problema mais evidente com estimar um modelo variável dependente manequim usando OLS é que as probabilidades previstas não são garantidos para estar dentro do intervalo [0,1]. OLS não pode ser modificado para resolver completamente este problema porque não linearidade nos parâmetros é necessária para garantir que todas as probabilidades previstas têm valores sensíveis. Em consequência, uma especificação alternativa devem ser usados. Econometristas escolher o probit ou a função logit.
Com uma função probit ou logit, as probabilidades condicionais são não-linearmente relacionado com a variável independente (s). Além disso, ambas as funções, têm a característica de se aproximar de 0 e 1 gradualmente (assintoticamente), de modo que as probabilidades previstas são sempre sensível.
A figura ilustra as probabilidades condicionais de um OLS (também conhecido como o modelo linear de probabilidade LPM), um probit, e um modelo logit.
Trabalhando a partir do CDF normal padrão: O modelo probit
O modelo probit é baseado na função normal padrão densidade cumulativa (CDF), que é definida como
Onde Z é uma variável normal padronizada e e é a base do log natural (o valor de 2,71828...).
Em um modelo probit, a CDF normal padrão substitui a função linear, de modo a estimar
Video: Função do Primeiro Grau (Função Afim): Coeficiente Angular e Coeficiente Linear (Aula 5 de 9)
Os termos beta não pode ser estimada utilizando OLS, então você precisa usar uma técnica conhecida como máxima verosimilhança (ML).
Para qualquer X, o modelo probit fornece a Z valor para a observação. O PDF padrão normal ou CDF pode então ser usado para obter a probabilidade de que Y = 1 para essa observação.
A figura a seguir mostra como fazer para encontrar a probabilidade para uma dada observação.
Depois de estimar um modelo probit, a maioria dos softwares econométrico pode calcular as probabilidades previstas para todas as observações da amostra.
Baseando-off da CDF logística: O modelo logit
O modelo de logit é baseado na função de densidade cumulativa logística (CDF), definido como
Onde G é uma variável aleatória e logística e é a base do log natural (o valor de 2,71828...).
A distribuição logística pode ser estranho para você, mas é semelhante a um padrão normal. No entanto, ele tem menor densidade dentro de um desvio padrão da média de uma distribuição normal padrão. A figura a seguir ilustra a diferença entre o padrão normal e as distribuições de logística.
Video: Comparando aplicações de funções lineares 1
Em um modelo logit, o CDF logística substitui a função linear de modo que você estimar
Nota: Você não pode usar OLS para estimar o betas- em vez disso, você tem que usar a técnica de probabilidade máxima (ML).
Para qualquer X, o modelo logit fornece o valor para a observação de que pode ser usado com o CDF logístico para encontrar a probabilidade de que Y = 1 para essa observação.
A figura a seguir ilustra como você encontrar a probabilidade para uma dada observação.
Quando você tiver seu modelo logit estimado, você pode usar software econométrico como STATA para calcular as probabilidades previstas para todas as suas observações da amostra.