Use gráficos de dispersão para identificar uma relação linear na análise de regressão simples

UMA gráfico de dispersão é um tipo especial de gráfico concebido para mostrar a relação entre as duas variáveis. Com a análise de regressão, você pode usar um gráfico de dispersão para inspecionar visualmente os dados para ver se X e Y estão linearmente relacionadas. O seguinte são alguns exemplos.

Esta figura mostra um gráfico de dispersão de duas variáveis ​​que têm uma relação não linear entre eles.

Gráfico de dispersão de uma relação não linear.
Gráfico de dispersão de uma relação não linear.

Cada ponto no gráfico representa um único (X, Y) Par. Uma vez que o gráfico não é uma linha recta, a relação entre X e Y é não-linear. Note-se que começa com os valores mais negativos X, Como X aumenta, Y em primeiro decreases- então como X continua a aumentar, Y aumenta. O gráfico mostra claramente que a inclinação é continuamente changing- não é uma constante. Com uma relação linear, a inclinação nunca muda.

Neste exemplo, um dos pressupostos fundamentais da análise de regressão simples é violada, e você precisa de uma outra abordagem para estimar a relação entre X e Y. Uma possibilidade é transformar o variables- por exemplo, você pode executar uma regressão simples entre ln (X) E ln (Y). ( “Ln” representa o logaritmo natural.) Isso muitas vezes ajuda a eliminar não-linearidades na relação entre X e Y. Outra possibilidade é usar um tipo mais avançado de análise de regressão, que pode incorporar relações não-lineares.

Esta figura mostra um gráfico de dispersão de duas variáveis ​​que têm uma relação linear fortemente positiva entre eles. A correlação entre X e Y é igual a 0,9.

gráfico de dispersão de uma relação linear fortemente positivo.
gráfico de dispersão de uma relação linear fortemente positivo.

A figura mostra uma tendência muito forte para X e Y tanto para aumento acima das suas possibilidades ou cair abaixo de suas possibilidades, ao mesmo tempo. A linha recta é um linha de tendência, projetado para chegar o mais perto possível para todos os pontos de dados. A linha de tendência tem uma inclinação positiva, que mostra uma relação positiva entre X e Y. Os pontos no gráfico são fortemente agrupados sobre a linha de tendência, devido à força da relação entre X e Y. (Nota: O declive da linha não é 0.9- 0.9 representa a correlação entre X e Y.)



A figura seguinte mostra um gráfico de dispersão de duas variáveis ​​que têm uma relação linear entre fracamente positiva eles- a correlação entre X e Y é igual a 0,2.

Gráfico de dispersão de uma relação linear fracamente positivo.
Gráfico de dispersão de uma relação linear fracamente positivo.

Esta figura mostra uma ligação fraca entre X e Y. Note-se que os pontos no gráfico são mais dispersos sobre a linha de tendência do que na figura anterior, devido à relação mais fraca entre X e Y.

A figura seguinte é um gráfico de dispersão de duas variáveis ​​que têm uma relação linear negativa forte entre eles- a correlação entre X e Y é igual a -0.9.

Gráfico de dispersão de uma relação linear fortemente negativo.
Gráfico de dispersão de uma relação linear fortemente negativo.

Esta figura mostra uma tendência muito forte para X e Y a mover-se em frente direções- por exemplo, se elevam acima ou cair abaixo dos seus meios, por vezes, opostas. A linha de tendência tem uma inclinação negativa, que mostra uma relação negativa entre X e Y. Os pontos no gráfico são fortemente agrupados sobre a linha de tendência, devido à força da relação entre X e Y.

A figura seguinte é um gráfico de dispersão de duas variáveis ​​que têm uma relação linear negativa fraca entre eles. A correlação entre X e Y é igual a -0.2.

Gráfico de dispersão de uma relação linear negativa fraca.
Gráfico de dispersão de uma relação linear negativa fraca.

Esta figura mostra uma ligação muito fraca entre X e Y. Note-se que os pontos no gráfico são mais dispersos sobre a linha de tendência do que na figura anterior devido à relação mais fraca entre X e Y.


Publicações relacionadas