O que fazer com valores discrepantes em seus dados métricas

A outlier

é qualquer ponto de dados que não se encaixam em seu padrão de dados média estabelecida. Ao prestar atenção aos valores discrepantes em seus dados de métricas de mídia social, você pode ver onde posicionar-se, concentrando-se em que os outliers são dados repetidos e quais começam a se multiplicar, o que indica uma tendência.

Existem dois tipos de valores atípicos em dados:

  • Outliers causados ​​por erros de medição ou de dados.

  • Outliers causada pelo primeiro indicador de mudanças de cauda longa em seus conjuntos de medição. (Long-tail é um termo de marketing referindo-se a resultados mostrados ao longo do tempo.)

Outliers causados ​​por erros

Para lidar com o primeiro tipo de outlier (um erro que você quer eliminar antes que corrompe seus dados), é preciso eliminá-lo. Eliminando o outlier requer várias etapas, a primeira das quais é exportar seus dados para uma planilha:

  1. Classificar seus dados de planilha por ordem crescente.

    Video: Box Plot passo a passo

  2. Localize o número médio.

    O número mediano de 3 e 4, por exemplo, é de 3,5.

  3. Encontrar o ponto em que 25 por cento das métricas em sua planilha são maiores.

    Video: Teorema de Pitágoras - calculando valor de cateto.MP4

    Isso é chamado de quartil superior, ou Q2.

  4. Encontrar o ponto em que 25 por cento das métricas em sua planilha são menores.



    Isso é chamado de quartil inferior, ou Q1.

  5. Subtrair Q1 do Q2.

    O resultado é a gama interquartil. Você precisa desta faixa para excluir os dados errados.

  6. Multiplique o QI (intervalo interquartil) por 1,5.

  7. Adicionar os resultados da etapa 6 para o quartil superior e então subtrair o quartil mais baixo.

    Esta etapa define parâmetros.

  8. Marque todos os dados fora deste conjunto de parâmetros como um outlier.

  9. Multiplique o QI por 3.

  10. Tome os resultados do Passo 9 e adicioná-lo ao quartil superior e subtrai-lo a partir do quartil inferior.

    O número resultante qualifica-se como um outlier extremo. valores atípicos extremos são os pontos de dados que você deve excluir de seus conjuntos de dados se você tiver dados errados.

Outliers causada pelo primeiro indicador de mudanças de cauda longa em seus conjuntos de medição

Se você está experimentando o segundo tipo de outlier (o primeiro indicador de uma mudança de cauda longa), então você precisa segui-lo e criar mais métricas para descobrir o que isso significa para o seu modelo de marca e de negócios.

Em vez de eliminar os dados, você deseja classificar-lo em seu próprio conjunto de dados de modo que você pode segui-lo ao longo do tempo. Essa classificação permite comparar os valores discrepantes de dados para o seu modelo de negócio e objetivos para ver se é um aumento da métrica.

Se você achar que a métrica é ganhando força, por assim dizer, então você sabe que é uma tendência futura emergentes e você pode transformar o seu foco futuro em direção a ela e crescer o seu negócio em uma nova direção.


Publicações relacionadas