Como avaliar os dados lineares com r

Naturalmente, R fornece um conjunto de diferentes testes e medidas para avaliar quão bem o seu modelo se encaixa seus dados, bem como olhar para os pressupostos do modelo. Mais uma vez, a visão geral aqui apresentado está longe de ser completa, mas dá-lhe uma idéia do que é possível e um ponto de partida para olhar mais profundo sobre o assunto.

Como resumir o modelo

o resumo() função imediatamente retorna o teste F para modelos construídos com AOV (). Para lm () modelos, este é um pouco diferente. Dê uma olhada na saída:

gt; Model.summary lt; - resumo (Modelo) gt; Model.summaryCall: lm (fórmula = mpg ~ em peso, de dados = mtcars) Resíduos: Min Max 1T Mediana 3T-4,5432 -2,3647 -0,1252 1,4096 6.8727Coefficients: Estimado Std. valor de erro t Pr (gt; | t |) (Intercept) 37,2851 1,8776 19,858 lt; 2e-16 *** peso -5,3445 0,5591 -9,559 1.29e-10 *** --- Signif. códigos: 0 `***` `** 0,001` 0,01 `*` 0,05 `` 0,1 `` 1Residual erro padrão: 3.046 em 30 graus de freedomMultiple R-quadrado: 0,7528, ajustado-R quadrado: 0.7446F-estatística: 91,38 em 1 e 30 DF, p-valor: 1.294e-10

Isso é um monte de informações úteis. Aqui você vê o seguinte:

  • A distribuição dos resíduos, o que lhe dá uma primeira ideia sobre o quão bem os pressupostos de um modelo linear hold

    Video: Análise de Regressão - Aula 2 - Regressão Linear utilizando o R

  • Os coeficientes acompanhada por um teste t, dizendo-lhe em que medida cada coeficiente é significativamente diferente de zero

  • As medidas do bem-de-R ajuste2 e o R ajustado2

  • O F-teste que lhe dá uma idéia sobre se o seu modelo explica uma parcela significativa da variância em seus dados

    Video: Tutorial_Análise Multivariada de Dados_Análise Discriminante Linear no Software R_Atuária UFC 2013.1



Você pode usar o coef () função para extrair uma matriz com as estimativas, erros padrão, e t-valor e p-valor para os coeficientes do objeto resumo assim:

gt; coef (Model.summary) Estimado Std. valor de erro t Pr (gt; | t |) (Intercept) 37,285126 1,877627 19,857575 8.241799e-19wt -5,344472 0,559101 -9,559044 1.293959e-10

Se esses termos não dizer nada, procurá-los em uma boa fonte sobre modelagem. Para uma extensa introdução à aplicação e interpretação de modelos lineares corretamente, confira Modelos estatísticos Linear Aplicada, 5a Edição, por Michael Kutner et ai (McGraw-Hill / Irwin).

Video: Análise Envoltória de Dados DEA Avaliação de Eficiência do Setor de Energia Elétrica

Como testar o impacto de termos modelo

Para se ter uma análise da tabela variância - como o resumo() função faz para um modelo ANOVA - você simplesmente usar o ANOVA () funcionar e passá-lo a lm () objeto de modelo como um argumento, como este:

gt; Model.anova lt; - ANOVA (Modelo) gt; Model.anovaAnalysis de Variância TableResponse: valor médio mpgDf Soma Sq Sq F Pr (gt; F) 1 em peso 847.73 847.73 91.375 1.294e-10 *** Residuais 30 278,32 9,28 --- Signif. códigos: 0 `***` `** 0,001` 0,01 `*` 0,05 `` 0,1 `` 1

Aqui, o objeto resultante é uma estrutura de dados que lhe permite extrair qualquer valor de que a tabela utilizando as ferramentas de subconjuntos e indexação. Por exemplo, para obter o p-valor, você pode fazer o seguinte:

gt; Model.anova [ `p`, `Pr (gt; F)`] [1] 1.293959e-10

Você pode interpretar este valor como a probabilidade de que a adição da variável wt para o modelo não faz a diferença. O valor-p baixo aqui indica que o peso de um carro (wt) Explica uma porção significativa da diferença em quilometragem (mpg) Entre os carros. Isto não deve vir como uma surpresa com um carro mais pesado faz, de fato, precisam de mais energia para arrastar o seu próprio peso ao redor.

Você pode usar o ANOVA () função para comparar modelos diferentes também, e muitos pacotes de modelagem fornecer essa funcionalidade. Você encontrar exemplos desta sobre a maioria das páginas da Ajuda relacionados, como ?anova.lm e ?anova.glm.


Publicações relacionadas