Como resolver problemas em análise preditiva

modelagem preditiva está ganhando popularidade como uma ferramenta para o gerenciamento de muitos aspectos do negócio. Assegurar que a análise dos dados é feito para a direita irá aumentar a confiança nos modelos utilizados - o que, por sua vez, pode gerar o buy-in necessário para análise preditiva para se tornar parte do conjunto de ferramentas padrão da sua organização.

Talvez este aumento da popularidade vem das maneiras em que um projeto de análise preditiva pode apoiar a tomada de decisão através da criação de modelos que descrevem conjuntos de dados, descobrir possíveis novos padrões e tendências (como indicado pelos dados), e prever resultados com maior confiabilidade.

Para alcançar este objetivo, um projeto de análise preditiva deve entregar um modelo que melhor se ajusta aos dados, selecionando as variáveis ​​de decisão correta e eficiente. Algumas questões vitais devem ser respondidas no caminho para esse objetivo:

  • Quais são os pressupostos mínimos e variáveis ​​de decisão que permitem o modelo para melhor atender os dados?

  • Como o modelo em construção comparar com outros modelos aplicáveis?

  • Que critérios são os melhores para avaliar e marcar este modelo?

Mais uma vez, você pode chamar a voz da experiência para o resgate: especialistas conhecimento de domínio pode discutir essas questões, interpretar quaisquer resultados que mostram padrões ocultos nos dados, e ajudar a verificar e validar a saída do modelo.

Como descrever as limitações do modelo de análise preditiva

Qualquer modelo analítico preditivo tem certas limitações com base nos algoritmos que emprega e o conjunto de dados que é executado. Você deve estar ciente dessas limitações e fazê-los trabalhar a seu advantage- as relacionadas com os algoritmos incluem

  • Se os dados têm padrões não-lineares (não forma uma linha)

  • Como altamente correlacionadas as variáveis ​​são (relações estatísticas entre recursos)

  • Se as variáveis ​​são independentes (sem relações entre recursos)

    Video: Como resolver o problema de análise de pacote

  • Se o âmbito dos dados da amostra torna o modelo propenso a overfitting

    Video: Apk não instala(erro na análise do pacote) como resolver



Para superar as limitações do seu modelo, som uso validação cruzada técnicas para testar seus modelos. Comece por dividir seus dados em treinamento e teste conjuntos de dados, e executar o modelo para cada uma dessas bases de dados separadamente para avaliar e marcar as previsões do modelo.

Video: Como resolver erro análise de pacote no Android

Como testar e avaliar o seu modelo de análise preditiva

Nenhum modelo pode produzir 100 por cento exato forecasts- qualquer modelo tem o potencial para produzir resultados imprecisos. Seja à procura de qualquer variação significativa entre as previsões do modelo produz e os dados observados - especialmente se as saídas do modelo contradizer o senso comum. Se parece muito bom, mau, ou extrema para ser verdade, então provavelmente não é verdade (a verdade, de qualquer maneira).

No processo de avaliação, examinar cuidadosamente as saídas dos modelos que você está testando e compará-los com as variáveis ​​de entrada. capacidade de previsão do seu modelo deve responder a todas as metas comerciais estabelecidas que levaram a sua criação em primeiro lugar.

Se erros ou desvios surgir na produção do seu modelo, tentar rastreá-los de volta para

  • A validade, a confiabilidade ea sazonalidade relativa dos dados

  • Premissas utilizadas no modelo

  • As variáveis ​​que foram incluídos ou excluídos na análise

Trabalho com usuários de negócios para avaliar cada etapa do Process- do seu modelo de certificar-se de que as saídas do modelo pode ser facilmente interpretada e usada em uma situação de negócios do mundo real. Equilibrar rigor e fiabilidade do modelo com a facilidade com que as saídas do modelo pode ser interpretado e colocar em prática.

Como evitar modelos de análise preditiva não escaláveis

Quando você está construindo um modelo, sempre manter a escalabilidade em mente. Sempre verifique o desempenho, precisão e confiabilidade do modelo em várias escalas. Seu modelo deve ser capaz de mudar sua escala - e escalar tão grande quanto necessário - sem caindo aos pedaços ou saída previsões ruins.

Escalabilidade foi um grande desafio no passado. modelos preditivos levou muito tempo para construir e para executar. Os conjuntos de dados dos modelos corriam sobre eram pequenos, e os dados era caro para recolher, armazenar e pesquisa. Mas isso era tudo na “pré-big data” era.

Hoje big data é barato, abundante, e crescente. Na verdade, um outro problema potencial assoma: O volume de dados formidável atualmente disponível pode afetar negativamente o modelo e degradar o seu desempenho, desatualização do modelo em um período relativamente curto de tempo. Adequadamente implementado, escalabilidade pode ajudar “à prova de futuro” seu modelo.

O futuro não é a única ameaça. Mesmo na era atual on-line, streaming de dados pode sobrecarregar um modelo - especialmente se os fluxos de aumento de dados a uma inundação.

volume de dados por si só pode causar as variáveis ​​de decisão e os fatores preditores de crescer para números gigantes que requerem contínua actualização para o modelo. Então, sim, o seu modelo melhor que seja escalável - rapidamente escalável.


Publicações relacionadas