Usando regressão linear para prever um resultado

pesquisadores estatísticos muitas vezes usam uma relação linear para prever o (média) valor numérico de Y

para um dado valor de X usando uma linha reta (o chamado linha de regressão). Se você sabe a inclinação ea y-intercepção da linha de regressão, em seguida, você pode conectar um valor para X e prever o valor médio para Y. Em outras palavras, você prever (a média) Y a partir de X.

Video: Regressão Linear

Se você estabelecer pelo menos uma correlação moderada entre X e Y tanto através de um coeficiente de correlação e um gráfico de dispersão, então você sabe que eles têm algum tipo de relação linear.

Nunca faça uma análise de regressão, a menos que você já encontrou pelo menos um moderadamente forte correlação entre as duas variáveis. (Uma boa regra é que deve ser no limite ou além positivo ou negativo 0,50.) Se os dados não se parecem com uma linha para começar, você não deve tentar usar uma linha para ajustar os dados e fazer previsões ( mas as pessoas ainda tentar).

Video: Ensina PET: Regressão Linear na Calculadora Científica

Antes de avançar para encontrar a equação para a sua linha de regressão, você tem que identificar qual das suas duas variáveis ​​é X e que é Y. Ao fazer correlações, a escolha de qual variável é X e que é Y não importa, contanto que você está consistente para todos os dados. Mas na montagem linhas e fazer previsões, a escolha de X e Y faz diferença.

Assim como você determinar qual variável é qual? Em geral, Y é a variável que você quer prever e X é a variável que você está usando para fazer essa previsão. Por exemplo, digamos que você está usando o número de vezes que uma população de grilos piar para prever a temperatura. Neste caso, você faria a variável Y a temperatura, e a variável X o número de silvos. Conseqüentemente Y pode ser prevista através X utilizando a equação de uma linha, se existir uma relação linear suficiente forte.



Os estatísticos chamam a X-variável (grilos neste exemplo) a variável de motivos, porque se X mudanças, a inclinação diz-lhe (ou explica) quanto Y deverá mudar em resposta. Portanto, o Y variável é chamado de resposta variável. Outros nomes para X e Y incluir o independente e dependente variáveis, respectivamente.

No caso de duas variáveis ​​numéricas, você pode vir até com uma linha que permite prever Y a partir de X, se (e somente se) estiverem preenchidas as duas condições seguintes:

  • A dispersão deve formar um padrão linear.

  • A correlação, r, é moderado a forte (tipicamente além 0,50 ou -0,50).

Alguns pesquisadores realmente não marcar estas condições antes de fazer previsões. Suas reivindicações não são válidos se forem satisfeitas as duas condições.

Mas suponha que a correlação é alta você ainda precisa de olhar para o gráfico de dispersão? Sim. Em algumas situações, os dados têm uma forma um pouco curvado, mas a correlação ainda é forte-, nestes casos, fazer previsões usando uma linha reta ainda é inválido. Previsões nestes casos precisam ser feitas com base em outros métodos que usam uma curva em seu lugar.


Publicações relacionadas