Como usar dados de alisamento em análise preditiva

suavização de dados

em análise preditiva é, essencialmente, tentando encontrar o “sinal” no “ruído”, descartando pontos de dados que são considerados “barulhento”. A ideia é aguçar os padrões nos dados e destacar as tendências dos dados está apontando.

A implicação atrás alisamento dados é que os dados consiste em duas partes: uma parte (que consistem no pontos de dados centrais) Que significa tendências gerais ou tendências reais, e uma outra parte que consiste principalmente de desvios (barulho) - alguns pontos flutuantes que resultam de alguma volatilidade nos dados. suavização de dados visa eliminar essa segunda parte.

Como para diminuir o ruído

suavização de dados opera em várias suposições:

  • Essa flutuação de dados é mais provável a ser ruído.

  • Que a parte barulhenta dos dados é de curta duração.

  • Que a flutuação dos dados, independentemente de quão variada que seja, não afetará as tendências subjacentes representadas pelos pontos de dados núcleo.

Ruído nos dados tende a ser aleatório suas flutuações não deve afetar as tendências gerais tiradas de examinar o resto dos dados. Assim, reduzindo ou eliminando pontos de dados ruidosos pode esclarecer as tendências e padrões reais nos dados - “relação sinal-ruído” com efeito, melhorar o dados

Desde que você tenha identificado o ruído corretamente e, em seguida, reduziu, suavização de dados pode ajudar a prever apontar os próximos dados observados simplesmente seguindo as principais tendências que você detectados nos dados.

suavização de dados se preocupa com a maioria dos pontos de dados, as suas posições em um gráfico, e quais são os padrões resultantes prever sobre a tendência geral de (digamos) um preço das ações, se a sua direção geral é para cima, para baixo ou para os lados.

Esta técnica não irá prever com precisão o preço exato do comércio próximo para um determinado estoque - mas prevendo uma tendência geral pode produzir insights mais poderosos do que saber o preço real ou suas flutuações.

Uma previsão baseada em uma tendência geral deduzida a partir de dados suavizados assume que qualquer direção que os dados tem seguido até agora continuará no futuro de uma forma consistente com a tendência. No mercado de ações, por exemplo, o desempenho passado não é indicação definitiva de desempenho futuro, mas certamente pode ser um guia geral para o futuro movimento do preço das ações.

Métodos, vantagens e desvantagens de suavização de dados

suavização de dados não é ser confundido com ajustamento de um modelo, que faz parte da análise de dados que consiste em dois passos:

  1. Encontrar um modelo adequado que representa os dados.

  2. Certifique-se de que o modelo se ajusta aos dados de forma eficaz.

suavização de dados se concentra em estabelecer uma direção fundamental para os pontos de dados núcleo por (1) ignorando quaisquer pontos de dados barulhento e (2) desenhando uma curva suave através dos pontos de dados que ignora os contorcendo e enfatiza padrões primários - tendências - nos dados, não importa como retardar seu surgimento. Por conseguinte, em uma série de tempo numérica, alisamento de dados serve como uma forma de filtragem.

suavização de dados pode usar qualquer um dos seguintes métodos:

  • Caminhada aleatória baseia-se na ideia de que o próximo resultado, ou ponto de dados futuro, é um desvio aleatório do último conhecido, ou presente, ponto de dados.

  • média móvel é uma média de execução de períodos consecutivos, igualmente espaçadas. Um exemplo seria o cálculo de uma média móvel de 200 dias de um preço das ações.

  • suavização exponencial atribui exponencialmente mais peso ou importância, a pontos de dados recentes do que para pontos de dados mais antigos.

  • Simples: Este método deve ser usado quando os dados de séries temporais não tem tendência e sem sazonalidade.

  • Linear: Este método deve ser usado quando os dados de séries temporais tem uma linha de tendência.

    Video: Condicionador que Alisa New Form de Kafus Professional

  • Sazonal: Este método deve ser usado quando os dados de séries temporais não tem nenhuma tendência, mas sazonalidade.



O que esses métodos de nivelamento todas têm em comum é que eles realizam algum tipo de processo média em vários pontos de dados. Tal média de pontos de dados adjacentes é a maneira essencial para zero em tendências ou padrões subjacentes.

As vantagens de alisamento são dados

  • É fácil de implementar.

  • Ela ajuda a identificar tendências.

  • Ela ajuda a expor padrões nos dados.

  • Ele elimina pontos de dados que você decidiu não são de interesse.

  • Ele ajuda a prever a direção geral dos próximos pontos de dados observados.

  • Ele gera bons gráficos suaves.

Mas tudo tem um lado negativo. As desvantagens de alisamento são dados

  • Pode eliminar pontos de dados válidos que resultam de eventos extremos.

  • Ela pode levar a previsões imprecisas se os dados teste é apenas sazonal e não plenamente representativo da realidade que gerou os pontos de dados.

  • Ele pode mudar ou distorcer os dados, especialmente os picos, resultando em uma imagem distorcida do que está acontecendo.

  • Ele pode ser vulnerável a perturbações significativas de valores atípicos dentro dos dados.

  • Pode resultar num grande desvio a partir dos dados originais.

Se suavização de dados não faz mais do que dar os dados um mero facelift, pode desenhar uma fundamentalmente errado nas seguintes maneiras:

  • Pode introduzir erros através de distorções que tratam os dados suavizados como se fosse idênticos aos dados originais.

  • Ele pode distorcer interpretação ignorando - e se escondendo - os riscos embutidos nos dados.

  • Ela pode levar a uma perda de detalhe dentro seus dados - que é uma maneira que uma curva suavizada pode divergir grandemente da dos dados originais.

Como seriamente suavização de dados pode afetar seus dados depende da natureza dos dados em mãos, e que alisando técnica foi implementada nesses dados. Por exemplo, se os dados originais tem mais picos na mesma, em seguida, suavização de dados vai levar a grande mudança desses picos nos gráficos suavizadas - muito provavelmente uma distorção.

Aqui estão alguns pontos de precaução para manter em mente quando você se aproxima de suavização de dados:

  • É uma boa idéia para comparar gráficos suavizada para gráficos intocadas que plotar os dados originais.

  • Os pontos de dados removidos durante a suavização de dados podem não ser ruídos poderiam ser válidos, os pontos de dados reais que são resultado de eventos raros-mas-real.

  • suavização de dados pode ser útil com moderação, mas seu uso excessivo pode levar a uma deturpação de seus dados.

Ao aplicar o seu julgamento profissional e sua experiência conhecimento do negócio, você pode usar dados suavização de forma eficaz. Remoção de ruído de seus dados - sem afetar negativamente a precisão ea utilidade dos dados originais - é pelo menos tanto uma arte quanto uma ciência.


Publicações relacionadas