Compreender a classificação de dados e seu papel na análise preditiva

A mineração de dados é uma parte necessária da análise preditiva. Na mineração de dados, classificação de dados

é o processo de etiquetar um item de dados como pertencentes a uma classe ou categoria. Um item de dados é também referida (no vocabulário de extracção de dados) como objecto de dados, a observação, ou instância.

Video: Geografia - Aula 3: Cartografia II (escala)

agrupamento de dados é diferente de classificação de dados:

  • agrupamento de dados é usada para descrever os dados por extracção grupos significativos ou categorias de um corpo de dados que contém elementos semelhantes.
  • A classificação de dados é usada para prever a categoria ou o agrupamento que um objecto de dados novo e recebida pertence.

Você pode usar a classificação de dados para prever novos elementos de dados com base em agrupamentos descoberto por um processo de agrupamento de dados. Continue lendo para descobrir como usar a classificação de dados para resolver um problema prático.

Empréstimo

Um empréstimo pode servir como um exemplo diário de classificação de dados. O oficial de empréstimo precisa analisar pedidos de empréstimo para decidir se o requerente será concedido ou negado um empréstimo.

Uma maneira de tomar uma decisão tão crítica é a utilização de um classificador para auxiliar no processo de tomada de decisão. Em essência, o classificador é simplesmente um algoritmo que contém instruções que indicam um computador como analisar as informações mencionadas no pedido de empréstimo, e como fazer referência a outros (fora) fontes de informação sobre o requerente. Em seguida, o classificador pode rotular o pedido de empréstimo de encaixe uma destas categorias de amostra, como “seguro”, “muito arriscado”, ou “seguro com condições”, assumindo que estas categorias exactas são conhecidos e rotulados nos dados históricos.

Ao remover a maior parte do processo de decisão das mãos do oficial de empréstimo ou underwriter, o modelo reduz o esforço de trabalho humano e risco da carteira da empresa. Isso aumenta o retorno do investimento (ROI), permitindo que os funcionários se originar mais empréstimos e / ou obter um melhor preço se a empresa decidir revender o empréstimo de maior qualidade.

Se o classificador volta com um resultado que rotula um candidato como “seguro com condições”, então o processador de empréstimo ou funcionário pode solicitar que o requerente preencher as condições a fim de obter o empréstimo. Se as condições forem atendidas, então os novos dados pode ser executado através do classificador novamente para aprovação. Usando a aprendizagem de máquina, o classificador pedido de empréstimo vai aprender com aplicações passadas, alavancar informações atuais mencionado na aplicação, e prever o comportamento futuro do requerente de empréstimo.

Como sempre, prever o futuro é sobre aprender com o passado e avaliar o presente. A classificação de dados baseia-se tanto informações passadas e atuais - e acelera a tomada de decisão, utilizando tanto mais rápido.

Marketing

Para ilustrar o uso de classificadores em marketing, considere um comerciante que foi atribuído a projetar uma estratégia de marketing inteligente para um produto específico. Compreender a demografia dos clientes impulsiona o desenho de uma estratégia de marketing eficaz. Em última análise, ajuda a empresa a selecionar produtos adequados para anunciar aos clientes com maior probabilidade de comprá-los.



Por exemplo, um dos critérios que você pode usar para selecionar clientes-alvo é a localização geográfica específica. Você pode ter uma loja desconhecida (ou uma loja que não é conhecido por vender um produto específico - digamos, uma loja de utensílios domésticos que poderiam começar a vender um novo processador de alimentos) e que pretende iniciar uma campanha de marketing para a nova linha de produtos.

Usando dados coletados ou comprados a partir de uma agência de marketing, você pode construir seu classificador. Você pode projetar um classificador que antecipa se os clientes vão comprar o novo produto. Para cada perfil de cliente, o classificador prediz uma categoria que se encaixa cada linha de produto é executado através dele, rotulando o cliente como (por exemplo) “interessado”, “não está interessado”, ou “desconhecido”.

Usando a análise produzida pelo classificador, você pode facilmente identificar as localizações geográficas que têm o maior número de clientes que se encaixam na categoria de “interessados”. Seu modelo descobre, por exemplo, que a população de San Francisco inclui um grande número de clientes que tenham adquirido um produto similar ao que você tem para venda.

Você saltar esta oportunidade para tomar medidas sobre o discernimento seu modelo acaba de apresentar a você. Você pode enviar um anúncio para que o novo gadget legal para os clientes - e só para eles.

Video: Avaliação da aprendizagem - Cipriano Luckesi

Para limitar os custos operacionais e de marketing, você deve evitar contato desinteressado clientes- o esforço desperdiçado afetaria o seu ROI. Para essa matéria, tendo muito contato desnecessário com os clientes pode diluir o valor de suas campanhas de marketing e aumentar a fadiga cliente até suas solicitações parecem mais como um incômodo. Você não quer que seus panfletos brilhantes para pousar imediatamente na lata de lixo ou seus e-mails para acabar na pasta de spam.

Como um comerciante, você pode querer usar dados sobre potenciais perfis dos clientes que foram coletados a partir de diferentes fontes, ou fornecidas por terceiros. Tais fontes incluem as mídias sociais e bases de dados de transações on-line históricos por parte dos clientes.

Cuidados de saúde

No campo da medicina, um classificador pode ajudar um médico depositam-se no tratamento mais adequado para um determinado paciente. Pode ser projetado para analisar os dados do paciente, aprender com ele, e classificar o paciente como pertencentes a uma categoria de pacientes semelhantes. O classificador pode aprovar recomendando o mesmo tratamento que ajudou pacientes similares da mesma categoria no passado.

Tal como nos exemplos anteriormente descritos, o classificador prediz uma etiqueta ou categoria de classe para a entrada, usando os dados tanto passadas e actuais. No caso da saúde, o modelo preditivo pode usar mais dados, mais rapidamente, para ajudar o médico a chegar a um tratamento eficaz.

Para ajudar os médicos a prescrever medicina individualizada, o classificador iria ajudá-los a determinar o estágio específico de doença do paciente. Hipoteticamente, os dados (digamos, a análise genética de uma amostra de sangue) pode ser alimentado a um classificador treinado que poderia rotular o estágio da doença um novo paciente. No caso de cancro (por exemplo), o classificador pode ter tais rótulos - que descrevem as seguintes classes ou grupos -. Como “saudáveis”, “benigna”, “fase inicial”, “metastático”, ou “terminais”

Qual é o próximo?

usos futuros de classificadores prometem ser ainda mais ambicioso. Suponha que você queira prever o quanto um cliente vai gastar em uma data específica. Nesse caso, você projetar um classificador que prevê valores numéricos, em vez de nomes de categoria especificados. Claro, preditores numéricos podem ser desenvolvidos usando não apenas métodos estatísticos como a regressão, mas também outras técnicas de mineração de dados, tais como redes neurais. Dado projetos suficientemente sofisticados, classificadores são comumente usados ​​em campos como as eleições presidenciais, a segurança nacional e da mudança climática.


Publicações relacionadas