Como introduzir os dados da regressão r para análise preditiva
O conjunto de dados que irá utilizar neste exemplo é o conjunto de dados Auto-MPG, que pode ser encontrado na repositório UCI
Conteúdo
Video: Análise de Regressão - Aula 1 - Elementos básicos do R
o rótulo é o esperado outcome- ele é usado para treinar e avaliar a precisão do modelo preditivo. O resultado que estamos tentando prever é o mpg esperado (atributo 1) de um automóvel quando dado os valores dos oito atributos.
Aqui estão os atributos na ordem da coluna em que são fornecidas:
mpg
cilindros
deslocamento
cavalo-vapor
peso
aceleração
ano modelo
origem
Video: Análise de Regressão - parte I
nome do carro
Para obter o conjunto de dados a partir do repositório UCI e carregá-lo na memória, digite o seguinte comando no console:
gt; autos lt; - read.csv ("https://archive.ics.uci.edu/ml/machine-learning-databases/auto-mpg/auto-mpg.data",
cabeçalho = FALSO, setembro =", As.is = TRUE)
Você vai ver que o conjunto de dados foi carregado na memória como a variável quadro de dados autos, olhando para o seu painel de espaço de trabalho (o painel superior direito). Clique no autos variável ao ver os valores dados no painel de fonte (o painel superior esquerdo).
Bache, K. & Lichman, M. (2013). Repositório de Aprendizagem UCI Machine [https://archive.ics.uci.edu/ml]. Irvine, CA: Universidade da Califórnia, Escola de Informação e Ciência da Computação.
Usando as funções de cabeça e cauda pode vir a calhar, por vezes, se você só quer ver os primeiros e últimos cinco linhas de dados. Esta é também uma maneira rápida de verificar se você realmente carregado o arquivo correto e que foi lido corretamente. A função pode dar-lhe estatísticas básicas sobre cada coluna dos dados.
Você pode copiar e colar o seguinte três linhas de código para o painel de origem e ter a saída mostrada na consola:
cabeça (automóveis, 5) da cauda (automóveis, 5) resumo (automóveis)