Aplicação de métodos estatísticos para os problemas econômicos

Econometria alunos sempre apreciar uma revisão dos conceitos estatísticos que são mais importantes para o sucesso com econometria. Especificamente, você precisa estar confortável com distribuições de probabilidades, o cálculo das estatísticas descritivas e testes de hipóteses.

Sua capacidade de quantificar com precisão as relações econômicas depende não apenas de suas habilidades de construção de modelos econométricos, mas também sobre a qualidade dos dados que você está usando para análise e sua capacidade de adotar as estratégias apropriadas para modelos que estimam que são susceptíveis de violar uma suposição estatística . Os dados devem ser derivadas de um processo de coleta confiável, mas você também deve estar ciente de quaisquer limitações ou desafios adicionais.

Eles podem incluir, mas não estão limitados a

  • Agregação de dados: A informação que pode ter se originado em uma casa, nível individual, ou empresa está sendo medido a uma cidade, município, estado ou nível de país em seus dados.

  • Estatisticamente correlacionados mas economicamente irrelevantes variáveis: Alguns conjuntos de dados contêm uma abundância de informação, mas muitas das variáveis ​​pode não ter nada a ver com a questão econômica você está esperando para resolver.

  • Dados qualitativos: conjuntos de dados ricos geralmente incluem variáveis ​​qualitativas (informação geográfica, raça e assim por diante), mas esta informação requer tratamento especial antes que você possa usá-lo em um modelo econométrico.

  • Classical modelo de regressão linear (CLRM) falha suposição: A legitimidade de sua abordagem econométrica sempre repousa sobre um conjunto de suposições estatísticas, mas é provável que você achar que pelo menos um desses pressupostos não se sustenta (ou seja, não é verdade para os seus dados).

Econometristas diferenciar-se dos estatísticos, enfatizando violações das suposições estatísticas que são frequentemente tomadas para concedido. A técnica mais comum para estimar um modelo econométrico é Mínimos Quadrados Ordinários (MQO). No entanto, uma série de suposições CLRM deve manter em ordem para a técnica de OLS para fornecer estimativas confiáveis. Na prática, os pressupostos que têm mais probabilidade de falhar depender de seus dados e aplicações específicas.

Reconhecendo a importância do tipo de dados, frequência e agregação

Os dados que você usa para estimar e testar o seu modelo econométrico é normalmente classificada em um dos três tipos possíveis:

  • corte transversal: Este tipo de dados consiste em medidas para observações individuais (pessoas, famílias, empresas, municípios, estados, países, ou qualquer outro) em um determinado ponto no tempo.

    Video: Distribuição Binomial:

  • séries temporais: Este tipo de dados consiste de medições em uma ou mais variáveis ​​(como o produto interno bruto, taxas de juros ou taxas de desemprego) ao longo do tempo em um determinado espaço (como um país específico ou estado).

  • Painel ou longitudinal: Este tipo de dados é constituído por uma série tempo para cada unidade de corte transversal da amostra. Os dados contêm medidas para observações individuais (pessoas, famílias, empresas, municípios, estados, países, e assim por diante) durante um período de tempo (dias, meses, trimestres ou anos).



O tipo de dados que você está usando pode influenciar a forma como você estima o seu modelo econométrico. Em particular, técnicas especializadas geralmente são obrigados a lidar com dados de séries temporais e do painel.

Video: Curso de Economia Aula 0003 Problemas econômicos fundamentais O que como para quem produzir

Você pode antecipar problemas econométricos comuns porque certas falhas CLRM suposição é mais provável com determinados tipos de dados. Dois casos típicos de falhas suposição CLRM envolvem heteroskedasticity (o que ocorre frequentemente em modelos usando dados da secção transversal) e autocorrelação (o que tende a estar presente em modelos usando dados de séries de tempo).

Além de saber o tipo de dados que você está trabalhando com, certifique-se que você está sempre ciente das seguintes informações:

  • O nível de agregação usado para medir as variáveis: O nível de agregação refere-se à unidade de análise, quando a informação é adquirida para os dados. Em outras palavras, as medições variáveis ​​podem ter origem a um nível inferior de agregação (como um indivíduo, agregado, ou firme) ou a um nível mais elevado de agregação (como uma cidade, estado, ou estado).

    Video: Curso de Matemática e Estatística Média aritmética ponderada Questão resolvida comentada passo passo

  • o freqüência com a qual os dados são capturados: A frequência refere-se à taxa à qual as medições são obtidas. dados de séries de tempo pode ser capturado com uma frequência mais elevada (como hora a hora, diariamente, semanalmente ou) ou com uma frequência inferior (como mensalmente, trimestralmente, ou anual).

Todos os dados no mundo não permitirá que você para produzir resultados convincentes, se o nível de agregação ou a frequência não é apropriado para o seu problema. Por exemplo, se você estiver interessado na determinação de como os gastos por aluno afeta o desempenho acadêmico, os dados de nível de estado provavelmente não será apropriado porque os gastos e as características dos alunos têm tanta variação entre as cidades dentro dos estados que seus resultados são susceptíveis de ser enganosa.

Evitar a armadilha de mineração de dados

Como você adquirir mais ferramentas de análise de dados, você pode estar inclinado a pesquisar os dados de relações entre variáveis. Você pode usar seu conhecimento das estatísticas para encontrar modelos que se encaixam seus dados muito bem. No entanto, esta prática é conhecida como mineração de dados, e você não quer ser seduzido por ela!

Embora a extracção de dados pode ser útil em áreas onde o mecanismo subjacente a gerar os resultados não é importante, a maioria dos economistas não exibir esta abordagem favoravelmente. Em econometria, a construção de um modelo que faz sentido e é reproduzível por outros é muito mais importante do que procurar um modelo que tem um ajuste perfeito.

Incorporando informação quantitativa e qualitativa

Os resultados económicos pode ser afectada por factores quantitativos (numéricos) e qualitativas (não-numéricos). Geralmente, a informação quantitativa tem uma aplicação direta e interpretação em modelos econométricos.

As variáveis ​​qualitativas são associados com características que não têm representação numérica natural, embora seus dados brutos pode codificar características qualitativas com um valor numérico. Por exemplo, uma região EUA pode ser codificada com um 1 para Oeste, 2 para Sul, 3 para Midwest, e 4 para o Nordeste. No entanto, a atribuição de valores específicos é arbitrária e não carrega nenhum significado especial.

A fim de utilizar as informações contidas nas variáveis ​​qualitativas, normalmente você vai convertê-los em variáveis ​​fictícias - variáveis ​​dicotômicas que assumem um valor de 1 se uma característica particular está presente e 0 caso contrário.

Às vezes, o próprio resultado econômico é qualitativa ou contém valores restritos. Por exemplo, a variável dependente pode medir se ou não uma empresa falhar (falência) de um determinado ano usando várias características das empresas como variáveis ​​independentes. Embora as técnicas clássicas são, por vezes, aceitável com variáveis ​​dependentes qualitativas e não contínuos, geralmente resultam em violações suposição e exigir uma abordagem alternativa econométrico.


Publicações relacionadas