Conectando análise preditiva para disciplinas relacionadas

Video: MOL2NET (Portuguese) Welcome Message by Prof. Tullius Scotti

A análise preditiva faz uso pesado de três disciplinas relacionadas: mineração de dados, estatísticas e aprendizado de máquina. Todas as quatro disciplinas se cruzam em grande medida tal que os seus nomes são freqüentemente usados ​​alternadamente. Apenas para manter o registro reto, existem algumas distinções: análise preditiva combina muitas das técnicas, ferramentas e algoritmos que a mineração de dados, estatísticas e aprendizado de máquina têm em comum.

Video: Android KitKat, Google Glass 2.0, smartphones modulares [CT News #30]

Seu objetivo, no entanto, é usar essas ferramentas para entender os dados, analisá-lo, aprender com ele, e criar um modelo matemático que pode fazer previsões de negócios úteis. Essa orientação futurista é o que diferencia a análise preditiva, uma vez que combina aspectos dos outros três disciplinas nas diversas etapas e ou etapas necessárias para desenvolver um modelo preditivo.

É a capacidade de previsão que diferencia este uso especializado de estatísticas, mineração de dados e aprendizagem de máquina. Vamos examinar as contribuições de cada disciplina.

Estatisticas

Estatísticas são números que resultam de medição de dados empíricos ao longo do tempo. Como uma disciplina, estatísticas se preocupa com coleta e análise de dados - muitas vezes para contar uma história em números.

As estatísticas podem inferir relações dentro data- portanto, desempenha um papel activo na apresentação de dados e incentivar a sua compreensão. Usando apenas uma amostra dos dados, as estatísticas podem dar-lhe uma base para inferir hipóteses sobre os dados como um todo. Assim, a disciplina é tanto descritivo e inferencial.

Estatística inferencial está preocupado em fazer inferências ou previsões sobre as características de uma população inteira de um conjunto de dados de amostra. Os dados da amostra para análise é escolhido aleatoriamente, de uma forma que representa (mas não inclui) o conjunto da população, que é difícil ter acesso. Quando o conjunto de dados de amostra é bem escolhido, analisando permite que o investigador para projetar os resultados da análise para toda a população com um grau mensurável de precisão.

Estatísticas depende, é claro, sobre a matemática para analisar os dados, verificando uma hipótese ou teoria, determinando a sua precisão, e chegar a uma conclusão.

É o trabalho dos estatísticos para provar ou refutar, com uma única amostra, se a sua hipótese sobre a população é verdade. O fato de que uma hipótese antecede a análise é uma distinção clara para as estatísticas, e uma característica que a diferencia de outras técnicas.

Ao contrário de mineração de dados, estatísticas não envolve limpeza de dados ou pré-processamento. Mas as estatísticas descritivas e mineração de dados têm dados de agrupamento em comum- ambos visam descrever os dados e definir os processos utilizados para classificá-lo.



Um denominador comum entre todas estas disciplinas é a matemática subjacente. A matemática está no coração de estatísticas, e todos os algoritmos e programação usado em mineração de dados, aprendizado de máquina e análise preditiva. Outro denominador comum é a análise de dados, uma busca por mais bem informadas decisões mais inteligentes sobre os resultados futuros.

Mineração de dados

mineração de dados está preocupado principalmente com a análise de dados através de descrever, resumindo, classificação e agrupamento dos dados, de modo a encontrar padrões úteis, links ou associações dentro dele.

A mineração de dados é muitas vezes usado como sinônimo de aprendizagem de máquina, mas existem algumas diferenças entre os dois termos. Por exemplo: os mineiros dos dados estão familiarizados com o uso de aprendizagem de máquina para executar algumas tarefas que envolvem grandes quantidades de dados. No entanto, eles também podem criar uma consulta sofisticado e otimizado em um banco de dados sem o uso de aprendizagem de máquina - que ainda seria considerado mineração de dados. Isto é semelhante à descoberta de conhecimento em bases de dados, (DCBD). Encontra conhecimento de dados e enfatiza uma ampla aplicação de determinadas técnicas de mineração de dados.

aprendizado de máquina

aprendizado de máquina é outra disciplina que se concentra na análise dos dados e fazer o sentido dele - mas fá-lo por ensinar um programa de computador para fazer o trabalho. Quanto mais dados são analisados, mais o sistema pode aprender sobre ele, o que esperar dele, eo que fazer com ele. A análise dos dados se torna uma fonte de feedback contínuo ao sistema, que prontamente analisa os dados, as tentativas de entender e dar sentido a ela, e fica melhor a essas tarefas.

Quando um novo caso especial, geralmente uma exceção ou um novo comportamento, é processado pela primeira vez, a base do sistema de conhecimento é incrementado para incluir o novo caso. Os casos mais especiais são tratados, o mais bem equipado do sistema é tomar decisões que produzem o resultado mais útil. Esta é a natureza da aprendizagem que a máquina é programada para fazer.

aprendizagem de máquina é o equivalente de ensinar um sistema as regras de um jogo, e em seguida, obter o sistema para praticar o jogo por jogar em níveis elementar e intermediário. Depois que a preparação, o sistema pode jogar em níveis avançados em tempo real.

IBM Watson usa processamento de linguagem natural e aprendizagem de máquina para revelar insights de grandes quantidades de dados não estruturados. Watson foi usado em um 2011 Perigo! coincidirem, e ganhou. Antes disso, o Deep Blue da IBM bateu o campeão mundial Gary Kasparov no xadrez. Em 2016, AlphaGo do Google bater o campeão do mundo, Lee SEDOL, em Go (um jogo muito mais difícil de conquistar, porque Go é exponencialmente mais complexa do que o xadrez).

aprendizagem de máquina é perfeitamente adequado para

Video: Abordagem Humanista

  • dados complexos
  • Os dados em várias formas
  • Os dados recolhidos a partir de diversas fontes
  • Dados em grandes quantidades

A mineração de dados pode descobrir conexões previamente desconhecidas e associações nos dados. aprendizado de máquina pode categorizar os novos e futuros desconhecidos, aprender com eles com base em seu processamento prévio dos dados e obter a melhor incorporá-los nos dados conhecidos. Ambas as técnicas levar a uma maior visão e compreensão dos dados.


Publicações relacionadas