Este documento describe el método de regresión por mínimos cuadrados para modelar la relación entre una variable dependiente y una o más variables independientes. Explica que este método busca encontrar la curva de ajuste que minimice la suma de los cuadrados de los errores entre los valores reales y los predichos por el modelo. Además, presenta un ejemplo ilustrativo de cómo aplicar este método para hallar la recta de regresión de mínimos cuadrados para un conjunto de datos.
2. La regresión
Al estudiar la relación entre dos o más variables surge la idea de
encontrar una expresión matemática que la describa. El análisis de
regresión tiene por objetivo identificar un modelo funcional que
describa cómo varía la esperanza (promedio) de una variable
dependiente Y, frente a cambios en una variable independiente X. Hay
varias maneras de desarrollar tales modelos; una es la conocida como
el método de mínimos cuadrados.
3. En la práctica es posible
adoptar modelos de regresión
que se pueden agrupar o
clasificar en lineales y no
lineales.
Modelos de Regresión.
La curva del modelo puede ser
recta, cuadrática, cúbica, etc.
El objeto es hallar la que más
se ajuste a los datos.
Por ejemplo, el modelo lineal
simple para los puntos de la
figura A, es y=1.8566x-5.0246
Figura A Figura B
Sin embargo, la figura B muestra
que si se elige un modelo
cuadrático y=0.1996𝑥2
-0.7281x-
1.3749 se logra mayor precisión
4. “
Como medida de qué tan bien se ajusta el modelo 𝑦 = 𝑓 𝑥 a la
colección de puntos 𝑥1, 𝑦1 , x2, y2 , x3, y3 , … (x 𝑛, y 𝑛)} se pueden
sumar los cuadrados de las diferencias entre los valores reales y los
valores dados por el modelo para obtener una suma de los cuadrados
de los errores.
5. Suma de los cuadrados de los errores
� 𝑆 reprentaría la suma de los cuadrados de los errores*
Si el modelo es perfecto S=0, pero esta perfeción
no es posible, por lo que optamos por un modelo
que haga mínimo el valor de S. A este modelo se
le llama recta de regresión o por mínimos
cuadrados.
*Diferencia entre el punto de la recta estimada y el punto del valor real dado.
6. Estimadores de la recta de mínimos cuadrados
Para esta expresión, 𝑎 y 𝑏 son estimadores que se obtienen de las derivadas
parciales de 𝑆(𝑎, 𝑏), necesario para conseguir el valor mínimo de 𝑆.
7. Ejemplo Ilustrativo.
Hallar la recta de regresión de mínimos cuadrados.
Halla la recta de regresión de mínimos cuadrados para los puntos −3,0 , −1,1 , 0,2 𝑦 2,3 . Para
𝑛 = 4
8. Caso.
Los clones son células genéticamente idénticas obtenidas del mismo individuo. Los
investigadores han identificado un clon de álamo que produce árboles fuertes que
crecen rápido. Estos árboles algún día podrían ser un recurso energético alternativo al
combustible convencional.
Los investigadores de la Universidad del Estado de Pensilvania plantaron Clon de álamo
252 en dos sitios diferentes: uno de los sitios estaba localizado a las orillas de una
ensenada con suelo rico y drenaje adecuado, y el otro lugar se encontraba en una colina
con suelo seco y arenoso. Midieron el diámetro, la altura y el peso seco de una muestra
de árboles de tres años de edad. Estos investigadores quieren saber si pueden predecir
cuánto pesa un árbol a partir de sus mediciones de diámetro y altura.
Como analista de los datos del proyecto, usted debe determinar si las mediciones de
diámetro y altura se pueden utilizar para predecir de forma confiable el rendimiento de
madera.
(Data extraída del tutorial de Minitab 15)
9. Caso.
Sombreamos la data, siempre recordando que en
la primera columna deben estar los datos del eje
X (D2A en este caso) y la segunda columna la
variable respuesta Y (Peso)
Se desea saber si los álamos muestran esta
relación y cuán fuerte es la misma, y para eso se
crea una gráfica de línea ajustada de Peso por
D2A.
*𝐷2𝐴 = (𝐷𝑖á𝑚𝑒𝑡𝑟𝑜)2
∗ 𝐴𝑙𝑡𝑢𝑟𝑎
*
Solución con Hoja de cálculo Excel.
11. Solución con Hoja de cálculo Excel.
Se genera un gráfico de
dispersión.
Elegimos el diseño de
gráfica que muestra los
estimadores de la recta por
mínimos cuadrados
1
2
Caso.
12. (Data extraída del tutorial de Minitab 15)
Peso D2A*
0,17 18,698104
0,15 14,15736
0,02 2,07866
0,16 16,359616
0,37 41,482064
0,73 84,420525
0,22 23,638967
0,3 35,695
0,19 20,1828
0,78 95,852013
0,6 66,83244
1,11 126,051066
0,04 4,63704
0,32 37,417408
0,07 73,6164
*𝐷2𝐴 = (𝐷𝑖á𝑚𝑒𝑡𝑟𝑜)2
∗ 𝐴𝑙𝑡𝑢𝑟𝑎
y = 0,0076x + 0,0121
R² = 0,7934
0
0,2
0,4
0,6
0,8
1
1,2
0 50 100 150
Regresión por mínimos
cuadrados
Series1
Lineal (Series1)
Solución con Hoja de cálculo Excel.
Estimadores
Al mirar esta gráfica,
se observa una
relación lineal
positiva entre Peso y
D2A. Es decir, a
medida que aumenta
D2A, aumenta Peso. El
valor de 𝑅2
indica que
D2A explica el 79.34%
de la variación en el
peso. Una inspección
visual de la gráfica
revela que la mayoría
de los datos está
dispersa de forma
aleatoria, pero
algunos puntos
pueden ser inusuales.
La ecuación de regresión es
y = 0.0121 + 0.0076x
Caso.
13. REFERENCIAS BIBLIOGRÁFICAS
o Estadística para la ciencias agropecuarias. Julio Alejandro Di Rienzo [et al.]. 7a
edición.
o Cálculo 2 de varias variables. Larson & Edwards. 9na. edición.
o Tutoriales de Minitab 15.