Formatando dados corretamente
Video: Como Formatar o PC e Instalar Windows 7 (Sem perder drivers e Arquivos)
Conteúdo
Os seres humanos usam experiência quando interpretam os dados que eles vêem, mas os computadores não podem. Seu software de mineração de dados fará o seu melhor para identificar o tipo de dados em cada coluna, mas os tipos de dados são muitas vezes ambígua.
Quando você vê uma lista de códigos postais, você não tentar somar e subtrair-los. Você sabe que eles representam lugares. Você entende isso, porque você tem muita experiência ver e reconhecer códigos postais. Um computador pode interpretar um código postal como um inteiro ou medida contínua. No final, cabe a você para definir o formato adequado.
Funções para definir formatos de dados e funções (tais como denotando a variável dependente para a modelagem) pode ser enterrado dentro de uma variedade de lugares em sua aplicação de mineração de dados. Você pode definir os formatos e papel das variáveis dentro de um arquivo de dados antes mesmo de abrir uma aplicação de mineração de dados (os formatos de dados nativos para Orange e Weka permitir isso), como parte da importação ou em algum momento mais tarde no processo.
Video: Como fazer backup dos dados antes de formatar o PC (Windows)
Você pode ter as ferramentas construídas para esta finalidade, como as ferramentas mostradas nas figuras a seguir, ou você pode definir essas propriedades dentro de outros procedimentos.
Cada aplicação de mineração de dados tem seu próprio conjunto de tipos de variáveis e seus próprios limites sobre como cada tipo pode ser usado. Alguns desses limites são baseados na teoria. Por exemplo, você só pode somar e subtrair números, não letras. Mas outros podem ser apenas uma questão de como o aplicativo foi projetado.
Assim, por exemplo, você pode achar que uma ferramenta de modelagem especial em um único aplicativo permite prever variáveis tanto categóricas e contínuas, mas uma ferramenta semelhante em outro aplicativo pode permitir a modelagem de apenas um ou o outro.