Como novas previsões analíticas com regressão r
Video: PREVISÃO-ANÁLISE DE REGRESSÃO.mp4
Conteúdo
Para fazer previsões analíticas com novos dados, você simplesmente usar a função com uma lista dos sete valores de atributos. O código a seguir faz esse trabalho:
Video: Estatística - Aula 16: Regressão Linear
gt; newPrediction lt; - prever (modelo,
lista (cilindros = factor de (4), o deslocamento = 370,
cavalos de potência = 150, peso = 3904, aceleração = 12, modelYear = factor (70), origem = factor de (1)),
= intervalo"prever", Nível = 0,95)
Este é o código e saída do novo valor de previsão:
Video: 4 - Regressão múltipla - ETV
gt; newPredictionfit LWR UPR1 14,90128 8,12795 21,67462
O que você tem aqui é a sua primeira previsão real a partir do modelo de regressão. Porque é a partir de dados invisíveis e você não sabe o resultado, você não pode compará-lo com qualquer outra coisa para descobrir se era correto.
Depois de ter avaliado o modelo com o conjunto de dados de teste, e você está feliz com a sua precisão, você pode ter confiança que você construiu um bom modelo preditivo. Você vai ter que esperar por resultados de negócios para medir a eficácia do seu modelo preditivo.
Pode haver otimizações que você pode fazer para construir uma melhor e mais eficiente modelo preditivo. Ao experimentar, você pode encontrar a melhor combinação de preditores para criar um modelo mais rápido e preciso.
Video: Vídeo da aula de 22 03 sobre regressão linear na previsão de demanda
Uma forma de construir um subconjunto de recursos é para encontrar a correlação entre as variáveis e remover as variáveis altamente correlacionadas. Removendo as variáveis redundantes que não acrescentam nada (ou adicionar muito pouca informação) para o ajuste, você pode aumentar a velocidade do modelo. Isto é especialmente verdadeiro quando você está lidando com muitas observações (linhas de dados) onde o poder ou a velocidade de processamento pode ser um problema.
Para um grande conjunto de dados, mais atributos em uma linha de dados vai abrandar o processamento. Então você deve tentar eliminar o máximo de informações redundantes possível.