Prever valores de clientes com a linha de regressão

Enquanto uma correlação fala para a força de uma relação entre duas variáveis, e o r

2 ajuda a explicar que a força do relacionamento, o que você precisa fazer para prever uma variável de outro é a utilização de uma extensão da correlação chamado análise de regressão. Análise de regressão é conhecido como um “burro de carga” em análise preditiva. A matemática não é muito complicado, ea maioria dos pacotes de software de suporte à análise de regressão.

A análise de regressão estende a idéia da dispersão usados ​​em correlação e adiciona uma linha que melhor se “encaixa” os dados.

Um dos requisitos da utilização de correlações e análise de regressão é que os dados é linear. Linear significa uma linha razoavelmente pode descrever a relação entre variáveis ​​e, em seguida, ser usada para prever valores que não aparecem em seus dados (pontos futuro de dados do cliente). Se o gráfico de dispersão dos dados forma uma curva, ou qualquer forma que uma linha não se encaixa bem, você pode obter resultados enganosos.

Embora existam muitas maneiras de desenhar linhas através dos dados, a análise dos mínimos quadrados é uma maneira matemática que reduz a distância entre a linha e cada ponto no gráfico de dispersão. Esta análise pode ser feito à mão ou usando softwares como o Minitab, SPSS, SAS, R, ou Excel.

A figura mostra uma linha de regressão por mínimos quadrados.

O software dá-lhe a equação para a linha de regressão acima do gráfico:

Tempo = 86,57 + 4.486 Taps

A equação de regressão toma a forma geral de

Aqui está uma explicação de cada parte da equação:

(Pronunciado y-chapéu): Este é o valor previsto da variável dependente: tempo previsto.

  • b0: Chamou o y-interceptam, é neste ponto que a linha seria cruzar (ou interceptar) com o y-eixo.



  • b1: Esta é a inclinação da linha previsto (como íngreme é).

    Video: Grings Correlação e Regressão linear aula 22

  • X: Isso representa um valor particular da variável independente: torneiras.

    Video: Regressão Linear Simples - Ajuste de Reta

  • e: representa o erro inevitável a previsão irá conter.

Assim, neste exemplo, a equação de regressão indica que o montante previsto de tempo que leva um cliente a fazer uma compra é igual a 86,57 (o y-intercepto) mais 4,486 (declive) multiplicado pelo número de torneiras (X).

É a fórmula de regressão que permite prever os valores dos clientes que não existem em seus dados. Ele permite que você execute “what-if”, analisa em valores de clientes futuros. Esta é a parte “preditivo” de análise de clientes preditivos.

Por exemplo, usando a equação de regressão do exemplo anterior, você pode prever quanto tempo um cliente leva para fazer uma compra com 38 torneiras. Você acabou de preencher 38 na equação de regressão.

Tempo = 86,57 + 4,486 (38)

Time = 86,57 + 170,47 = 257,04

Um cliente precisa de 257 segundos, ou um pouco mais de quatro minutos, para fazer uma compra que requer 38 torneiras.

A variável dependente é denotado “Y” e é apresentada no eixo y (vertical). A variável independente é chamado X e é apresentado no eixo horizontal (x).

Em vez de prever o tempo tarefa de um cliente de torneiras, esta mesma abordagem pode ser usada para prever outros análise de clientes, incluindo:

  • receitas de clientes das receitas publicitárias

  • Probabilidade de recomendar a partir de dados de usabilidade

    Video: Vídeo da aula de 22 03 sobre regressão linear na previsão de demanda

  • Número de conversões de páginas vistas website


Publicações relacionadas