Definición: El Línea de regresión es la línea que mejor se ajusta a los datos, de modo que la distancia total desde la línea a los puntos (valores variables) trazados en un gráfico es la más pequeña. En otras palabras, una línea utilizada para minimizar las desviaciones cuadradas de las predicciones se denomina línea de regresión.
Hay tantas líneas de regresión como variables. Supongamos que tomamos dos variables, digamos X e Y, entonces habrá dos líneas de regresión:
- Recta de regresión de Y sobre X: Esto da los valores más probables de Y a partir de los valores dados de X.
- Recta de regresión de X sobre Y: Esto da los valores más probables de X a partir de los valores dados de Y.
La expresión algebraica de estas líneas de regresión se llama Ecuaciones de regresión. Habrá dos ecuaciones de regresión para las dos líneas de regresión.
La correlación entre las variables depende de la distancia entre estas dos líneas de regresión, por ejemplo, cuanto más cercanas están las líneas de regresión, mayor es el grado de correlación, y cuanto más alejadas están las líneas de regresión, menor es el grado de correlación.
Se dice que la correlación es perfecta positiva o perfecta negativa cuando las dos líneas de regresión coinciden, es decir, solo existe una línea. En caso de que las variables sean independientes; entonces la correlación será cero y las líneas de regresión estarán en ángulos rectos, es decir, paralelas al eje X y al eje Y.
Nota: Las líneas de regresión se cortan entre sí en el punto de promedio de X e Y. Esto significa que, desde el punto donde las líneas se cruzan, la perpendicular se dibuja en el eje X, obtendremos el valor medio de X. De manera similar, si la horizontal Si se dibuja una línea en el eje Y obtendremos el valor medio de Y.
¿Te ha resultado útil??
0 / 0