Como prever novos valores de dados com r

Além de descrever as relações, os modelos também podem ser usados ​​para prever valores para novos dados. Para isso, muitos sistemas modelo em R usar a mesma função, convenientemente chamada prever()

. Cada paradigma de modelagem em R tem uma função de prever com seu próprio sabor, mas em geral a funcionalidade básica é a mesma para todos eles.

Video: Análise de Variância (ANOVA), Teste de Tukey e Valor-P no R

Como obter os valores de dados

Por exemplo, um fabricante de automóveis tem três projetos para um carro novo e quer saber o que a quilometragem prevista é baseada no peso de cada novo design. A fim de fazer isso, você primeiro criar um quadro de dados com os novos valores - por exemplo, como este:

gt; new.cars lt; - data.frame (p = c (1.7, 2.4, 3.6))

Certifique-se sempre os nomes das variáveis ​​que você usa são as mesmas usadas no modelo. Quando você faz isso, você simplesmente chamar a prever() funcionar com os argumentos adequados, como este:

gt; predizer (Modelo, newdata = new.cars) 12328,19952 24,45839 18,04503

Assim, o carro mais leve tem uma quilometragem prevista de 28,2 milhas por galão eo carro mais pesado tem uma quilometragem prevista de 18 milhas por galão, de acordo com este modelo. Claro, se você usar um modelo inadequado, as previsões podem ser praticamente fora também.

Confiança em suas previsões



Para se ter uma idéia sobre a precisão das previsões, você pode pedir para intervalos em torno de sua previsão. Para obter uma matriz com a previsão e um intervalo de confiança de 95 por cento em torno da previsão média, você definir o argumento intervalo para `confiança` como isso:

Video: Curso do RStudio: 1 - Apresentação e carga de dados

gt; predizer (Modelo, newdata = new.cars, intervalo = `confiança`) LWR ajuste UPR1 28,19952 26,14755 30,251502 24,45839 23,01617 25,900623 18,04503 16,86172 19,22834

Agora você sabe que - de acordo com o seu modelo - um carro com um peso de 2,4 toneladas tem, na média, uma quilometragem entre 23 e 25,9 milhas por galão. Da mesma forma, você pode pedir um intervalo de previsão de 95 por cento, definindo o intervalo de argumento para `predição`:

gt; predizer (Modelo, newdata = new.cars, intervalo = `previsão`) LWR ajuste UPR1 21,64930 28,19952 24,45839 18,07287 34,749752 30,843923 18,04503 11,71296 24,37710

Esta informação diz que 95 por cento dos carros com um peso de 2,4 toneladas têm uma quilometragem em algum lugar entre 18,1 e 30,8 milhas por galão - assumindo que o seu modelo é correto, é claro.

Video: Curso de Estatística R Como calcular valores mínimo máximo Dados não agrupados Programa R Software R

Se você preferir construir o seu próprio intervalo de confiança, você pode obter os erros padrão em suas previsões bem, definindo o argumento se.fit para VERDADE. Você não pode pegar um vetor ou uma matriz-em vez disso, você obtém uma lista com um elemento em forma que contém as previsões e um elemento se.fit que contém os erros padrão.


Publicações relacionadas