Análise de clientes e períodos de treinamento e validação

Video: Métricas e Relacionamento com o cliente para vender

Uma abordagem sofisticada e muitas vezes essencial para a análise de séries temporais envolve particionar seus dados de clientes em períodos de treinamento e validação. No período de treinamento, você construir uma equação de regressão na primeira seção de dados (cerca de dois terços a três quartos dos seus dados).

Video: Satisfação do Cliente: uma coisa simples que faz toda a diferença

Você, então, aplicar a equação de regressão para a parte posterior de seus dados no período de validação para ver o quão bem os dados anteriores, na verdade, prevê os dados posteriores.

Com os dados do assinante, você poderia usar os primeiros 20 meses (janeiro 2012 a agosto de 2013) como o período de treinamento e setembro 2013 a fevereiro de 2014 como o período de validação. Esta abordagem é testar a equação usando dados que você já tem, que é o mais perto que você pode começar a testar o quão bem uma previsão pode executar quando novos dados vem em.

A equação de regressão para os primeiros 20 meses é:

Inscritos = 2033.9e0,0269X

a r² = 0,9979, que mostra um bom ajuste para a linha exponencial. Você pode então usar esta equação de regressão para ver quão bem ele prevê os últimos seis meses do conjunto de dados. Os últimos seis meses são 21 a 26. A figura mostra os valores previstos e reais para agosto 2013 a fevereiro de 2014, classificou o Validation (na coluna Período).

Para avaliar o quão bem essa previsão realmente é, duas colunas adicionais foram criados. O primeiro é o erro em bruto a partir do número real para a previsão. Por exemplo, em setembro de 2013, a previsão era curto por 5 assinantes. Em fevereiro de 2014, ele foi curto por 28. Este tipo de erro crua pode-se ser compreensível, se você estiver familiarizado com os dados do cliente que você está trabalhando.

Ao comunicar o quanto de erro seus valores previstos têm, muitas vezes é mais fácil de falar em termos de porcentagem de erro.

A percentagem de erro médio absoluto (MAPE) pode ser um pouco mais compreensível para as partes interessadas. É calculado por encontrar o valor absoluto da diferença entre os valores reais e previstos, em seguida, dividindo essa diferença pelo valor real para calcular o erro percentual absoluto. Esta é então a média para cada valor.



A coluna MACACO mostra a percentagem de erro absoluto. Por exemplo, para Janeiro de 2013, a equação de regressão previu 2.885 subscribers- o número real de assinantes era 2.844, ou seja, a equação superestimou por 41 assinantes.

Aplicando a fórmula Excel para o erro percentual absoluto (APE) gera um erro de 1,4%:

= ABS (2885-2844) / 2885 = 0,014 ou 1,4%

A MAPE para o período de treinamento é 0,589%. A MAPE para o período de validação é 0,870%, o que é um pouco mais elevada, mas ambas estão ainda inferior a 1%.

Finalmente, as previsões para março, abril e maio 2014 são 4.205, 4.320 e 4.437.

= Exp (0,0269 * 27) * = 2033,9 4205

= Exp (0,0269 * 28) * = 2033,9 4320

= Exp (0,0269 * 29) * = 2033,9 4437

Há uma série de técnicas mais sofisticadas que podem fazer modelos mais precisos tendo em conta a sazonalidade e autocorrelação, e depois alisar os dados para melhor interpretar padrões. Software como JMP e Minitab têm estas características embutidas.

Prever o futuro é sempre arriscado, porque você está assumindo que o futuro terá padrões semelhantes aos do passado. Na maioria dos casos ele faz e pode ser um excelente indicador do comportamento do cliente. No entanto, os eventos incomuns (indignado clientes em mídias sociais, um ataque terrorista, ou recessão) que são imprevisíveis podem afetar substancialmente a precisão de suas previsões. Tratar previsões como um guia, não absoluta.


Publicações relacionadas