Como calcular a regressão linear múltipla para seis sigma

Video: Regressão Múltipla

O que deve praticantes de Seis Sigma ver com todas as situações em que mais de um X influencia a Y? Você usa regressão linear múltipla. Afinal de contas, esse tipo de situação é mais comum do que uma única variável que influencia é. Quando você trabalha para criar uma equação que inclui mais de uma variável - como Y = f(X1, X2, . . ., Xn).

A forma geral do modelo de regressão linear múltipla é simplesmente uma extensão do modelo de regressão linear simples Por exemplo, se você tem um sistema onde X1 e X2 ambos contribuem para Y, o modelo de regressão linear múltipla torna-se

YEu = β0 + β1X1 + β11X12 + β2X2 + β22X22 + β12X1X2 + ε

Essa equação apresenta cinco tipos distintos de termos:

β0: Este termo é o efeito global. Ele define o nível de partida para todos os outros efeitos, independentemente do que o X variáveis ​​são definidas pelo.

  • βEuXEu: O β1X1 e β2X2 peças são o efeitos principais termos na equação. Assim como no modelo de regressão linear simples, estes termos capturar o efeito linear cada XEu tem na saída Y. A magnitude e direcção de cada um destes efeitos são capturados no β associadaEu coeficientes.

    Video: Regressão Linear e o Mínimo Quadrado

  • βiiXEu2: p11X12 e β22X22 são as segunda ordem ou efeitos quadrados para cada um dos Xs. Uma vez que a variável é levantada para a segunda potência, o efeito é quadrática em vez de linear. A magnitude e direcção de cada um destes efeitos de segunda ordem são indicadas pelo β associadaii coeficientes.

  • β12X1X2: Este efeito é chamado de efeito de interacção. Este termo permite que as variáveis ​​de entrada para ter um efeito interactiva ou combinada sobre o resultado Y. Mais uma vez, a magnitude e a direcção do efeito de interacção são capturados no β12 coeficiente.

  • ε, representando este prazo para toda a variação aleatória que os demais termos não pode explicar. ε é uma distribuição normal com o seu centro no zero.

  • A equação para a regressão linear múltipla pode caber muito mais que um simples de linha pode acomodar curvas, superfícies tridimensionais e relacionamentos ainda abstratas em n-dimensional do espaço! regressão linear múltipla pode lidar com qualquer coisa que você jogue com ele. O processo para a realização de regressão linear múltipla segue o mesmo padrão que a regressão linear simples faz:

    1. Reunir os dados para o Xs e o Y.



    2. Estimar os vários coeficientes de regressão linear.

      Quando você tem mais de um X variáveis, as equações para derivar os ps se tornar muito complexo e muito tedioso. Você definitivamente quer usar uma ferramenta de software de análise estatística para calcular estas equações automaticamente para você. Os ps apenas pop direita para fora. Caso contrário, vá comprar uma caixa de número 2 lápis e arregaçar as mangas!

    3. Verifique os valores residuais para confirmar que cumprem os pressupostos iniciais do modelo de regressão linear múltipla.

      Verificando que os resíduos são normais é extremamente importante. Se a variação dos resíduos não é centrada em zero e a variação não é aleatória e normal, os pressupostos de partida do modelo de regressão linear múltipla não foram cumpridos, eo modelo é inválida.

    4. Realizar testes estatísticos para ver quais os termos dos vários termos equação de regressão linear são significativas (e deve ser mantido no modelo) e que são insignificantes (e precisam ser removidos).

      Alguns termos da equação de regressão múltipla não são significativas. Você descobrir quais realizando uma F teste para cada termo da equação. Quando a contribuição variação de um termo equação é pequeno em comparação com a variação residual, esse termo não vai passar o F testar, e você pode removê-lo a partir da equação.

      Seu objetivo é simplificar a equação de regressão, tanto quanto possível, maximizando a R2 métrica de ajuste. Geralmente, mais simples é sempre melhor. Então, se você encontrar duas equações de regressão que ambos têm o mesmo R2 valor, você quer resolver sobre o com os termos menor número, mais simples.

      Normalmente, os termos de ordem superior são os primeiros a ir. Há apenas menos chance de um termo quadrado ou um termo de interação estatisticamente significativa.

    5. Calcular o coeficiente final da determinação R2 para o modelo de regressão linear múltipla.

      Use o R2 métrica para quantificar quanto da variação observada a sua equação final explica.

    Com um bom software de análise se tornando mais acessível, o poder de regressão linear múltipla está disponível para uma audiência crescente. Muitas ferramentas mais sofisticadas de software de análise estatística algoritmos até ter automatizados que pesquisar as várias combinações de termos de equação, maximizando R2.


    Publicações relacionadas