Que el estudiante, se capacite en el tratamiento estadístico de datos experimentales utilizando el método de mínimos cuadrados. Explicar qué es un diagrama de dispersión y cuál es la causa de la dispersión de los datos en dicho diagrama
2. CONTENIDO
5.1 Ajuste de Curvas
5.2 Análisis de Regresión
5.2.1 Métodos de Mínimos Cuadrados
5.2.2 Regresión Lineal
5.2.3 Regresión Curvilínea
5.2.3.1 Función Potencial: YC = a Xb
5.2.3.2 Función Exponencial: YC = a bx
3. 5.1 AJUSTE DE CURVAS
Uno de los objetivos en el análisis de resultados es el
llegar a establecer una relación cuantitativa entre dos o
más variables y mediante esta relación poder efectuar
predicciones.
Por lo general la relación consiste en una ecuación que
expresa cómo la variable dependiente (cuyo valor se
desea predecir) es afectada por una o más variables
independientes.
4. En esta unidad se ilustra la forma de establecer la posible
relación de una variable dependiente con otra variable
considerada independiente. El primer paso es disponer
de una colección de datos obtenidos experimentalmente.
Si se simbolizan por X y Y las variables independiente y
dependiente respectivamente, y sus valores particulares
por X1, Y1, X2, Y2, etc., en una tabla se dispondrían así.
El siguiente paso es representar los puntos (X1, Y1 ), (X2,
Y2) . . . . , (XN, YN) en un sistema de coordenadas
rectangulares. El sistema de puntos resultantes se llama
diagrama de dispersión.
5. Con el diagrama de dispersión es posible representar una
curva que se aproxime a los datos, es decir, que siga la
tendencia de los mismos. Tal curva se llama curva de
aproximación.
En la figura 5.1 (a) , por ejemplo, se ve que los datos
experimentales se aproximan bien a una línea recta y se
dice que entre las variables existe una relación lineal. En
b), existe una relación no lineal.
6. Las curvas mostradas en la Fig. 5.1 se denominan curvas
de aproximación y describen la tendencia de los puntos
en el diagrama de dispersión. El problema general de
hallar la ecuación de la curva de aproximación que se
ajuste mejor al conjunto de datos con los que se obtuvo el
diagrama de dispersión se denomina determinación de la
CURVA DE AJUSTE.
Una curva de aproximación como la de la Fig. 5.1 (a)
sugiere una ecuación lineal; (ecuación de la recta) Y = a +
bX; mientras que la de la curva en la Fig. 5.1 (b) sugiere
una ecuación cuadrática (parabólica) de la forma Y = a +
bX + cX2
7. La dispersión de los puntos se debe a los errores que
afectan en el proceso de medición tanto a la variable
dependiente como a la independiente. En ocasiones
puede despreciarse el error en la variable independiente
al compararse con el error (o variación aleatoria) de la
variable dependiente. Esto dependerá de la situación
particular de las causas de error sobre cada variable al
realizar el experimento.
11. 5.2 ANÁLISIS DE REGRESIÓN
Uno de los propósitos principales de la curva de ajuste es
estimar una de las variables a partir de la otra. El proceso
de estimación se conoce como regresión. Si Y se va a
estimar a partir de X por medio de alguna ecuación la
llamamos ecuación de regresión de Y sobre X y a la curva
correspondiente curva de regresión de Y sobre X.
A continuación se presentan algunos ejemplos de
relaciones denominadas funciones o ecuaciones de
predicción:
12. Línea Recta:
Yc = a + bX
Ecuación de segundo grado o cuadrática:
Yc = a + bX + cX2
Ecuación potencial:
Yc = KXn o Yc = aXb
Ecuación exponencial:
Yc = A DX o Yc = a bX
13. En estos ejemplos, Yc representa el valor estimado de la
variable dependiente a partir del valor X, de la variable
independiente.
Existen varios métodos para determinar la ecuación de
regresión. El "método de mínimos cuadrados", que se
describe mas adelante, se considera el mejor; por
fundamentarse en el tratamiento estadístico de los datos
experimentales.
14. Como se mencionó anteriormente, los errores afectan
tanto a la variable independiente como a la variable
dependiente, sin embargo en muy diversos casos la
variable independiente puede considerarse sin error (o
de error despreciable) y considerar que la dispersión es
debido únicamente a los errores en la variable
dependiente. En este caso se considera que para un valor
puntual de X (sin error) el valor experimental de Y se
aparta del valor que predice la curva de regresión.
15. 5.2.1 MÉTODO DE MÍNIMOS CUADRADOS
Generalmente, más de una curva de un tipo dado parece
ajustarse a un conjunto de datos. Para evitar el juicio
individual en la construcción de rectas, parábolas u otras
curvas de aproximación, es necesario obtener una
definición de la "mejor curva de ajuste", mejor parábola
de ajuste," etc.
Considérese la Fig. 5.2 en la cual los puntos de un
conjunto de datos (hipotéticamente experimentales) se
expresan por (X1 , Y1), (X2, Y2) . . . . . (Xn, Yn).
16. Para un valor dado de x, por ejemplo X1 habrá una
diferencia entre el valor de Y1 y el valor correspondiente
de la curva C.
Esta diferencia se denota por D1 y se conoce como
desviación, error, o residuo y puede ser positivo, negativo
o cero. Análogamente, correspondiendo a los valores X2 ,
X3 . . . , XN obtenemos las desviaciones D2 , D3 , . . . , DN
17. Una medida de la "bondad de ajuste" de la curva C al
conjunto de datos la suministra la cantidad D1
2 + D2
2 +
….. + DN
2. Si la suma es pequeña el ajuste es bueno, si es
grande, el ajuste es malo.
Definición:
De todas las curvas de aproximación correspondientes a
un conjunto de puntos dados, la curva que tenga la
propiedad de que D1
2 + D2
2 + ….. + DN
2 es mínimo, se
conoce como la mejor curva de ajuste.
18. Una curva con esta propiedad se dice que ajusta los datos
por mínimos cuadrados y se llama "Curva de regresión
de mínimos cuadrados" o simplemente "Curva de
mínimos cuadrados“.
Una recta con esta propiedad se llama recta de mínimos
cuadrados, una parábola con esta propiedad se llama
parábola de mínimos cuadrados, etc.
19. 5.2.2 REGRESIÓN LINEAL
Se aplica el método de mínimos cuadrados para
determinar la ecuación de regresión. Para una relación
lineal en general Yc = a + bX ; Yc representa el valor
teórico de Yi ó el valor estimado de Y que corresponde a
un valor particular de X.
El criterio de mínimos cuadrados requiere la
determinación de los valores de "a" y "b" tal que Z = Σ(Yi
- Yc)2 sea un mínimo (es decir, que tienda a cero). En la
ecuación de la relación lineal "a" y "b" se denominan
coeficientes de regresión:
"a" es la intercepción con el eje de las ordenadas Y
"b" es la pendiente de la línea, que mejor se ajusta.
20. Como se busca la recta que mejor se ajuste a los puntos
experimentales, el intercepto “a” y la pendiente “b”
adquieren el carácter de variables; ya que estos
parámetros son los que diferencian a una recta de otra.
Sea:
Z = Σ(Yi - Yc)2
Sustituyendo Yc = a + bX
Z = Σ(Yi - a - bX)2
Debe ser un mínimo de acuerdo a la definición de mejor
curva de ajuste (en este caso, mejor recta de ajuste).
21. Utilizando el cálculo diferencial con derivadas parciales
actuando sobre sumatorias, se llega a establecer un
sistema de dos ecuaciones, denominadas ecuaciones
normales para la regresión lineal o ecuaciones normales
para la recta de mínimos cuadrados.
Donde n es el número de pares ordenados (X, Y) o
número de puntos o número de observaciones, a y b son
incógnitas que representan, como ya se mencionó,
respectivamente, el intercepto y la pendiente de la recta
de mínimos cuadrados.
22. Para resolver estas ecuaciones se requiere obtener ΣX,
ΣY, ΣXY y ΣX2
Simultaneando las ecuaciones (1) y (2), de manera literal,
estás se disponen de la siguiente manera:
23. Ejemplo:
Se quiere determinar la constante “K” (N/m) de un
resorte, a partir de la ley de Hooke. Para el experimento se
dispone de diferentes masas y por cada variación de masa,
se mide la deformación del resorte.
El equipo con el cual, se harán las pruebas se muestra a
continuación:
24. La tabla de datos, generada a partir de la observación es:
Considere las siguientes observaciones:
La ley de Hooke: Fs = K*x (N)
Aceleración de la gravedad: g = 9.78 m/s2
Construya preliminarmente la tabla de datos que
relacione la fuerza con la deformación:
25. La tabla de datos, generada a partir de la observación es:
Construya el diagrama de dispersión, para la relación
entre las variables de fuerza contra deformación del
resorte. Con esto se verificará la tendencia de los datos
experimentados.
28. Al analizar la dispersión de los datos y trazando la
tendencia de ellos, podemos observar que es una relación
lineal. Por lo consiguiente aplicaremos el método de
mínimos cuadrados.
Acomodando las ecuaciones de mínimos cuadrados a las
variables que poseemos en el experimento:
Construya la tabla para satisfacer las relaciones
anteriores:
31. Finalmente, la ecuación de regresión queda así:
Se tomaran dos de los datos de la variable independiente
y se realizara una interpolación con la ecuación calculada
(a través del método de mínimos cuadrados).
Este procedimiento se realizara para determinar la
“Curva de regresión de mínimos cuadrados”
33. 5.2.3 Regresión Curvilínea
5.2.3.1 Función potencial o curva geométrica: Yc = aXb
Aplicando logaritmo a la función Yc = aXb, tenemos:
Log Yc = Log a + b Log X
Tal como hemos dicho anteriormente, la expresión
(Log Yi - Log Yc)2 es un mínimo; sustituyendo en esta
expresión Log Yc por su valor, tenemos:
(Log Yi - Log a - b Log X)2 (es un mínimo)
34. Al derivar parcialmente con respecto a "a" y respecto a
"b" e igualar a cero las derivadas, obtenemos las
ecuaciones normales siguientes:
Log Y = n Log a + b Log X (1)
Log X Log Y = Log a Log X + b (Log X)2 (2)
Despejando para “a” y “b” tenemos que:
35. Ejemplo:
Una muestra de un gas ideal se expande, según la tabla
de datos extraídos del experimento; el proceso se da en
condiciones de cuasiequilibrio, para el cual podemos
decir que la relación entre las variables es: P = kVb
38. Relacionando las ecuaciones para determinar las
variables “a” y “b”
Aplicándola a nuestras variables
Plantear la tabla en relación con las ecuaciones:
39. Tabla con los datos obtenidos:
Sustituir los datos calculados en las ecuaciones, para
determinar las constantes “k” y “b”
41. La Ecuación de regresión se puede expresar como:
De acuerdo al planteamiento anterior, la relación entre las
variables se puede escribir de la siguiente manera:
(Pa)
43. 5.2.3 REGRESIÓN CURVILÍNEA
5.2.3.2 Caso Exponencial: Yc = A DX
La función exponencial se presenta en multitud de
fenómenos de crecimiento animal, vegetal, económico,
físicos, etc. En todos ellos la variable mas usada es el
tiempo.
En el crecimiento exponencial, cada valor de “Y” se
obtiene multiplicando el valor anterior por una cantidad
constante “D”
44. Donde “A” es el valor inicial para x=0, además, “A” es el
factor por el que se multiplica en cada unidad de la
variable independiente. Si 0 < D < 1 se trata de un
decrecimiento exponencial.
La función exponencial sirve para describir cualquier
proceso que evolucione de modo que el aumento (o
disminución) en un pequeño intervalo, sea proporcional
a lo que había al comienzo del mismo.
Al aplicar cálculo integral, se llega a una expresión del
tipo Y = A DX , que es una relación exponencial ya que x
está como exponente de una base D.
45. Para encontrar la función que mejor se ajusta a los
resultados obtenidos, haremos uso de los mínimos
cuadrados.
Aplicando logaritmo a Yc = ADX tenemos:
Log Yc = Log A + X Log D
Como en los casos anteriores, interesa minimizar la
expresión:
Z = (Log Yi - Log a - X Log b)2
46. Al derivar parcialmente con respecto a “A" y “D" e igualar
a cero las derivadas llegamos a las siguientes ecuaciones
normales:
Log Yi = n Log A + Log D Xi (1)
X Log Yi = Log A Xi + Log D Xi
2 (2)
En este caso, X representa a la variable independiente, y
Y es la variable dependiente. Despejando para “A” y “D”:
47. Ejemplo:
Se lleva a verificación la ley de enfriamiento de Newton y
se dispone el equipo como se muestra en la figura. Luego
que el termómetro alcanza el equilibrio en el medio
ambiente, se obtuvieron los siguientes datos:
48. Fundamento Teórico:
La ley de enfriamiento de Newton se escribe como:
Donde:
dT/dt: representa la rapidez del enfriamiento
T: es la temperatura instantánea del cuerpo
K: es una constante que define el ritmo del enfriamiento
To: es la temperatura del ambiente
Si el cuerpo se enfría a partir de la temperatura Tm hasta
una To y la ley de enfriamiento de Newton es válida para
explicar su enfriamiento, la ecuación:
49. Cuantificando el fenómeno, se recogieron los siguientes
valores experimentales; donde cada cinco minutos se leía
el termómetro expuesto al medio (To = 32 oC)
52. Relacionando las ecuaciones para determinar las
variables “A” y “D” :
Aplicándola a nuestras variables:
Plantear la tabla en relación con las ecuaciones:
54. Sustituir los datos calculados en la tabla, para las
ecuaciones de mínimos cuadrados:
55. De acuerdo al planteamiento anterior, la relación entre las
variables se puede escribir de la siguiente manera:
Realizando la mejor curva de ajuste, a partir de la
ecuación de ajuste
58. UNIDAD V
ANÁLISIS DE DATOS
EXPERIMENTALES
POR MÍNIMOS CUADRADOS
(Ejercicios adicionales)
59. Ejercicio 13
Un grupo de alumnos investigaron sobre el movimiento
parabólico de un balín, los valores que obtuvieron se
muestran en la tabla siguiente:
a. Diagrama de dispersión y dibujar curva de aprox.
b. Ecuación de regresión
c. Encontrar el error en el exponente
67. Ejercicio 16:
Un grupo de alumnos investigo la relación que existe
entre la variación de temperatura y el tiempo que tarde en
enfriarse hasta la temperatura ambiente
a. Hacer diagrama de dispersión
b. Dibujar curva de aproximación
c. Determinar la ecuación de regresión