Anuncios

Descubre la ecuación de la recta de regresión: guía completa + ejemplos

¿Qué es la recta de regresión?

La recta de regresión es una herramienta fundamental en el análisis de datos y estadística. Se utiliza para modelar y predecir la relación entre dos variables continuas. En pocas palabras, la recta de regresión nos permite trazar la trayectoria promedio de una variable dependiente en función de una variable independiente.

Anuncios

¿Cómo se calcula la ecuación de la recta de regresión?

Para calcular la ecuación de la recta de regresión, es necesario emplear el método de mínimos cuadrados. Este método busca encontrar la línea recta que minimiza la suma de los errores al cuadrado entre los valores observados y los valores predichos por la línea de regresión.

El proceso para calcular la ecuación de la recta de regresión consta de varios pasos:

Paso 1: Recolectar los datos

En primer lugar, se deben recolectar los datos de las dos variables que se desean analizar. Es importante tener en cuenta que los datos deben ser representativos de la población o del fenómeno que se está estudiando. Una vez que se tienen los datos, se puede proceder al siguiente paso.

Paso 2: Calcular las medias

El siguiente paso es calcular las medias de las variables independiente (X) y dependiente (Y). Para ello, se suman todos los valores de cada variable y se dividen entre el número total de observaciones. Las medias se representan como X̄ (media de X) y Ȳ (media de Y).

Anuncios

Paso 3: Calcular las desviaciones

A continuación, se deben calcular las desviaciones de cada valor de X y Y respecto a sus medias. Estas desviaciones se denotan como (Xi – X̄) para X y (Yi – Ȳ) para Y. Es decir, se resta a cada valor su respectiva media.

Paso 4: Calcular los productos de las desviaciones

El siguiente paso es calcular los productos de las desviaciones, es decir, multiplicar cada desviación de X por su respectiva desviación de Y. Estos productos se representan como (Xi – X̄)(Yi – Ȳ).

Anuncios

Paso 5: Calcular las sumas de los productos de las desviaciones

Una vez que se tienen los productos de las desviaciones, se suman todos estos productos. La suma de los productos de las desviaciones se representa como ∑(Xi – X̄)(Yi – Ȳ).

Paso 6: Calcular las sumas de las desviaciones al cuadrado

En este paso, se deben calcular las sumas de las desviaciones de X y Y al cuadrado. Es decir, se eleva al cuadrado cada desviación de X (Xi – X̄) y cada desviación de Y (Yi – Ȳ), y luego se suman todas estas elevaciones al cuadrado. Estas sumas se representan como ∑(Xi – X̄)² para X y ∑(Yi – Ȳ)² para Y.

Paso 7: Calcular la pendiente de la recta de regresión

La pendiente de la recta de regresión (b) se calcula dividiendo la suma de los productos de las desviaciones (∑(Xi – X̄)(Yi – Ȳ)) entre la suma de las desviaciones al cuadrado de X (∑(Xi – X̄)²). La fórmula para calcular la pendiente es: b = ∑(Xi – X̄)(Yi – Ȳ) / ∑(Xi – X̄)².

Paso 8: Calcular el intercepto de la recta de regresión

Una vez que se tiene la pendiente de la recta de regresión, se puede calcular el intercepto (a) de la recta. El intercepto representa el punto en el que la recta corta al eje Y cuando la variable X es igual a cero. La fórmula para calcular el intercepto es: a = Ȳ – b * X̄.

Paso 9: Construir la ecuación de la recta de regresión

Finalmente, se puede construir la ecuación de la recta de regresión utilizando la pendiente y el intercepto calculados en los pasos anteriores. La ecuación de la recta de regresión tiene la forma: Y = a + b * X.

Ejemplos de aplicación de la ecuación de la recta de regresión

Ahora que conocemos el proceso para calcular la ecuación de la recta de regresión, veamos algunos ejemplos de su aplicación en situaciones reales.

Ejemplo 1: Ventas de una tienda

Supongamos que una tienda de ropa quiere analizar la relación entre el número de clientes que ingresan a la tienda (variable X) y las ventas diarias (variable Y). Después de recolectar los datos durante un mes, se obtienen los siguientes resultados:

X: [10, 15, 20, 25, 30]
Y: [200, 350, 400, 450, 500]

Aplicando el método de mínimos cuadrados, calculamos la pendiente y el intercepto de la recta de regresión:

X̄ = (10 + 15 + 20 + 25 + 30) / 5 = 20
Ȳ = (200 + 350 + 400 + 450 + 500) / 5 = 380

Σ(Xi – X̄)(Yi – Ȳ) = (10 – 20)(200 – 380) + (15 – 20)(350 – 380) + (20 – 20)(400 – 380) + (25 – 20)(450 – 380) + (30 – 20)(500 – 380) = -1800

Σ(Xi – X̄)² = (10 – 20)² + (15 – 20)² + (20 – 20)² + (25 – 20)² + (30 – 20)² = 200

b = Σ(Xi – X̄)(Yi – Ȳ) / Σ(Xi – X̄)² = -1800 / 200 = -9

a = Ȳ – b * X̄ = 380 – (-9) * 20 = 560

Por lo tanto, la ecuación de la recta de regresión es: Y = 560 – 9 * X.

Ejemplo 2: Temperatura y consumo de energía

Imaginemos que queremos estudiar la relación entre la temperatura ambiente (variable X) y el consumo de energía en un edificio (variable Y). Recolectamos datos durante un mes y obtenemos los siguientes resultados:

X: [20, 25, 30, 35, 40]
Y: [1500, 1800, 2100, 2400, 2700]

Aplicando el método de mínimos cuadrados, realizamos los cálculos:

X̄ = (20 + 25 + 30 + 35 + 40) / 5 = 30
Ȳ = (1500 + 1800 + 2100 + 2400 + 2700) / 5 = 2100

Σ(Xi – X̄)(Yi – Ȳ) = (20 – 30)(1500 – 2100) + (25 – 30)(1800 – 2100) + (30 – 30)(2100 – 2100) + (35 – 30)(2400 – 2100) + (40 – 30)(2700 – 2100) = 45000

Σ(Xi – X̄)² = (20 – 30)² + (25 – 30)² + (30 – 30)² + (35 – 30)² + (40 – 30)² = 200

b = Σ(Xi – X̄)(Yi – Ȳ) / Σ(Xi – X̄)² = 45000 / 200 = 225

a = Ȳ – b * X̄ = 2100 – 225 * 30 = 13275

Por lo tanto, la ecuación de la recta de regresión es: Y = 13275 + 225 * X.

P: ¿La ecuación de la recta de regresión siempre es una línea recta?

Sí, la ecuación de la recta de regresión siempre representa una línea recta. Sin embargo, dependiendo de los datos y la relación entre las variables, esta línea puede tener una pendiente positiva o negativa, así como también puede ser ascendente o descendente.

P: ¿Qué significa la pendiente en la ecuación de la recta de regresión?

La pendiente (b) de la ecuación de la recta de regresión indica cómo varía la variable dependiente (Y) cuando la variable independiente (X) aumenta en una unidad. Si la pendiente es positiva, significa que ambas variables tienen una relación directa, es decir, cuando X aumenta, Y también aumenta. Por el contrario, si la pendiente es negativa, indica una relación inversa, donde cuando X aumenta, Y disminuye.

P: ¿Cómo se interpreta el intercepto en la ecuación de la recta de regresión?

El intercepto (a) representa el valor esperado de la variable dependiente (Y) cuando la variable independiente (X) es igual a cero. En otras palabras, es el punto de corte de la recta de regresión con el eje Y. El intercepto proporciona información sobre el valor inicial de Y antes de que se tenga en cuenta la variable X.

Recuerda que la ecuación de la recta de regresión es una herramienta útil para analizar y predecir la relación entre variables. Siempre es importante tener en cuenta la interpretación adecuada de la pendiente, el intercepto y los datos específicos de cada situación.