1. Guía de estudio Matemática V
19
TEMA 3
POLINOMIOS INTERPOLANTES Y AJUSTE DE CURVAS
3.1. INTERPOLACIÓN
En el subcampo matemático del análisis numérico, se denomina interpolación a la
construcción de nuevos puntos partiendo del conocimiento de un conjunto discreto
de puntos.
En ingeniería y algunas ciencias es frecuente disponer de un cierto número de
puntos obtenidos por muestreo o a partir de un experimento y pretender construir
una función que los ajuste.
Otro problema estrechamente ligado con el de la interpolación es la aproximación
de una función complicada por una más simple. Si tenemos una función cuyo
cálculo resulta costoso, podemos partir de un cierto número de sus valores e
interpolar dichos datos construyendo una función más simple. En general, por
supuesto, no obtendremos los mismos valores evaluando la función obtenida que
si evaluásemos la función original, si bien dependiendo de las características del
problema y del método de interpolación usado la ganancia en eficiencia puede
compensar el error cometido.
En todo caso, se trata de, a partir de n parejas de puntos (xk,yk), obtener una
función f que verifique
n
k
y
x
f k
k ,
,
1
,
)
(
a la que se denomina función interpolante de dichos puntos. A los puntos xk se les
llama nodos. Algunas formas de interpolación que se utilizan con frecuencia son la
interpolación polinómica, la interpolación lineal (la cual es un caso particular de la
anterior), la interpolación por medio de spline o la interpolación polinómica de
Hermite.
3.1.1. Interpolación polinómica de Lagrange:
En análisis numérico, el polinomio de Lagrange, llamado así en honor a Joseph-
Louis de Lagrange, es el polinomio que interpola un conjunto de puntos dado en la
forma de Lagrange. Fue descubierto por Edward Waring en 1779 y redescubierto
más tarde por Leonhard Euler en 1783.
Dado que existe un único polinomio interpolador para un determinado conjunto de
puntos, resulta algo confuso llamar a este polinomio el polinomio interpolador de
Lagrange. Un nombre más conciso es interpolación polinómica en la forma de
Lagrange.
Dada un conjunto de n + 1 puntos:
2. Guía de estudio Matemática V
20
))
(
,
(
,
)),
(
,
( 0
0 n
n x
f
x
x
f
x
donde todos los i
x se asumen distintos, el polinomio interpolador en la forma de
Lagrange es la combinación lineal:
)
(
)
(
)
(
)
(
:
)
( 0
0
0
x
L
y
x
L
y
x
L
x
f
x
P n
n
j
n
j
j
de bases polinómicas de Lagrange:
)
(
)
(
)
(
)
(
)
(
)
(
)
(
)
(
)
(
)
(
:
)
(
1
1
1
1
1
1
0
0
,
0 n
j
n
j
j
j
j
j
j
j
j
n
j
i
i i
j
i
j
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
L
Desventajas de su uso
Debido a que el polinomio interpolador de Lagrange ajusta a todos los puntos que
le son especificados, en situaciones con una gran cantidad de datos se obtiene un
polinomio de grado muy alto, lo cual normalmente resulta impráctico. Es por esta
razón que en la práctica no es común utilizar este método, sino que se prefiere
ajustar los datos lo mejor posible, utilizando un polinomio de menor grado, incluso
si este polinomio no pasa por ninguno de los puntos que le son especificados
(pero ajusta en forma aproximada siguiendo algún criterio de optimalidad).
Otro problema del polinomio interpolador de Lagrange es lo que se conoce como
overfitting (término inglés, algunas veces castellanizado a sobre fiteo): a medida
que crece el grado del polinomio interpolador, se percibe una creciente variación
entre puntos de control consecutivos, lo que produce que la aproximación entre
dos puntos continuos sea muy distinta a la que uno esperaría.
A pesar de estos problemas, el polinomio interpolador de Lagrange es muy simple
de implemetar y tiene interés teórico más que práctico por su sencillez.
Ejemplo:
Construya los polinomios interpolantes de Lagrange para la función f(x) = sen(x)
en los puntos x0 = -1.5, x1 = − 0.75, x2 = 0, x3 = 0.75, x4 = 1.5 , evalúe en x = 1.
Solución:
x0 = -1.5 f(x0) = − 0.99749
x1 = − 0.75 f(x1) = − 0.68164
x2 = 0 f(x2) = 0
x3 = 0.75 f(x3) = 0.68164
x4 = 1.5 f(x4) = 0.99749
3. Guía de estudio Matemática V
21
Con cinco puntos, el polinomio interpolador tendrá, como máximo, grado cuatro
(es decir, la máxima potencia será cuatro), al igual que cada componente de la
base polinómica.
La base polinómica es:
)
(
)
(
)
(
)
(
)
(
)
(
)
(
)
(
)
(
4
0
4
3
0
3
2
0
2
1
0
1
0
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
L
)
2
/
3
2
/
3
(
)
2
/
3
(
)
4
/
3
2
/
3
(
)
4
/
3
(
)
0
2
/
3
(
)
0
(
)
4
/
3
2
/
3
(
)
4
/
3
(
x
x
x
x
x
x
x
x
9
1
27
2
81
16
243
32 2
3
4
)
(
)
(
)
(
)
(
)
(
)
(
)
(
)
(
)
(
4
1
4
3
1
3
2
1
2
0
1
0
1
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
L
)
2
/
3
4
/
3
(
)
2
/
3
(
)
4
/
3
4
/
3
(
)
4
/
3
(
)
0
4
/
3
(
)
0
(
)
2
/
3
4
/
3
(
)
2
/
3
(
x
x
x
x
x
x
x
x
9
8
27
32
81
32
243
128 2
3
4
)
(
)
(
)
(
)
(
)
(
)
(
)
(
)
(
)
(
4
2
4
3
2
3
1
2
1
0
2
0
2
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
L
)
2
/
3
0
(
)
2
/
3
(
)
4
/
3
0
(
)
4
/
3
(
)
4
/
3
0
(
)
4
/
3
(
)
2
/
3
0
(
)
2
/
3
(
x
x
x
x
1
9
20
81
64 2
4
x
x
)
(
)
(
)
(
)
(
)
(
)
(
)
(
)
(
)
(
4
3
4
2
3
2
1
3
1
0
3
0
3
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
L
)
2
/
3
4
/
3
(
)
2
/
3
(
)
0
4
/
3
(
)
0
(
)
4
/
3
4
/
3
(
)
4
/
3
(
)
2
/
3
4
/
3
(
)
2
/
3
(
x
x
x
x
x
x
x
x
9
8
27
32
81
32
243
128 2
3
4
)
(
)
(
)
(
)
(
)
(
)
(
)
(
)
(
)
(
3
4
3
2
4
2
1
4
1
0
4
0
4
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
L
4. Guía de estudio Matemática V
22
)
4
/
3
2
/
3
(
)
4
/
3
(
)
0
2
/
3
(
)
0
(
)
4
/
3
2
/
3
(
)
4
/
3
(
)
2
/
3
2
/
3
(
)
2
/
3
(
x
x
x
x
x
x
x
x
9
1
27
2
81
16
243
32 2
3
4
Así, el polinomio interpolador se obtiene simplemente como la combinación lineal
entre los y los valores de las abscisas:
)
(
)
(
)
(
)
(
)
(
)
(
)
(
)
(
)
(
)
(
)
( 4
4
3
3
2
2
1
1
0
0 x
L
x
f
x
L
x
f
x
L
x
f
x
L
x
f
x
L
x
f
x
P
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
9
1
27
2
81
16
243
32
99749
.
0
9
8
27
32
81
32
243
128
68164
.
0
9
8
27
32
81
32
243
128
68164
.
0
9
1
27
2
81
16
243
32
99749
.
0
2
3
4
2
3
4
2
3
4
2
3
4
x
x 99014
.
0
14451
.
0 3
Ahora evaluamos este polinomio en x = 1 para obtener
84564
.
0
)
1
(
99014
.
0
)
1
(
14451
.
0
)
1
( 3
P , tenemos que para )
1
(
)
1
( sen
f
84147
.
0
, por lo que el error relativo cometido es
Er = %
496
.
0
100
84147
.
0
84564
.
0
84147
.
0
100
*
p
p
p
P(x)
f(x)
5. Guía de estudio Matemática V
23
3.1.2. Diferencias divididas interpolantes de Newton:
Éste método es más algorítmico y resulta sumamente cómodo en determinados
casos, sobre todo cuando queremos calcular un polinomio interpolador de grado
elevado.
Tomemos f una función y escribamos su polinomio interpolador de grado m como
sigue:
)
(
)
)(
(
)
)(
(
)
(
)
( 1
1
0
1
0
2
0
1
0
n
n
n x
x
x
x
x
x
a
x
x
x
x
a
x
x
a
a
x
P
(1)
)
)
(
(
)
(
1
0
1
0
i
j
j
m
i
i
n x
x
a
a
x
P
Estos coeficientes se calculan mediante diferencias divididas, cuya expresión
general esta dada por:
i
j
i
j
i
i
j
i
i
j
i
i
x
x
x
x
f
x
x
f
x
x
f
1
1
1
1
]
,
,
[
]
,
,
[
]
,
,
[
Como se ve en la fórmula, las diferencias divididas se calculan de modo recursivo
usando coeficientes anteriores. Una vez hayamos realizado todos los cálculos,
notaremos que hay (muchas) más diferencias divididas que coeficientes ai. El
cálculo de todos los términos intermedios debe realizarse simplemente porqué son
necesarios para poder formar todos los términos finales. Sin embargo, los
términos usados en la construcción del polinomio interpolador son todos aquéllos
que involucren a x0, así:
]
[ 0
0 x
f
a , ,
],
,
[ 1
0
1
x
x
f
a ]
,
,
,
[ 1
0 i
i x
x
x
f
a
Con esta notación, podemos reexpresar la ecuación (1) como:
)
(
)
)(
](
,
,
,
,
[
)
)(
](
,
,
[
)
](
,
[
]
[
)
(
1
1
0
2
1
0
1
0
2
1
0
0
1
0
0
n
n
n
x
x
x
x
x
x
x
x
x
x
f
x
x
x
x
x
x
x
f
x
x
x
x
f
x
f
x
P
A esta ecuación se le conoce con el nombre de fórmula de diferencias divididas
interpolantes de Newton
Ejemplo:
Queremos hallar el valor de la función
1
)
(
x
e
x
f para x = 0.75 mediante el
método de las Diferencias Divididas de Newton de grado 2.
Solución:
Una forma sencilla de hacer los cálculos anteriores es determinando
sucesivamente las entradas de un arreglo triangular:
6. Guía de estudio Matemática V
24
x )
(x
f Primeras diferencias
divididas
Segundas diferencias
divididas
0
x )
( 0
x
f
0
1
0
1
1
0
)
(
)
(
]
,
[
x
x
x
f
x
f
x
x
f
0
2
1
0
2
1
2
1
0
]
,
[
]
,
[
]
,
,
[
x
x
x
x
f
x
x
f
x
x
x
f
1
x )
( 1
x
f
1
2
1
2
2
1
)
(
)
(
]
,
[
x
x
x
f
x
f
x
x
f
2
x )
( 2
x
f
x )
(x
f Primeras diferencias
divididas
Segundas diferencias
divididas
0 e 0
2
/
1
]
,
[
2
/
3
1
0
e
e
x
x
f
)
(
2 2
/
3
e
e
0
1
2
2
2
2
]
,
,
[
2
/
3
2
/
3
2
2
1
0
e
e
e
e
x
x
x
f
)
2
(
2 2
/
3
2
e
e
e
2
1 2
/
3
e 2
/
1
1
]
,
[
2
/
3
2
2
1
e
e
x
x
f
)
(
2 2
/
3
2
e
e
1 2
e
El polinomio de diferencias divididas interpolantes de Newton de grado 2 es:
)
)(
](
,
,
[
)
](
,
[
]
[
)
( 1
0
2
1
0
0
1
0
0
2 x
x
x
x
x
x
x
f
x
x
x
x
f
x
f
x
P
)
2
/
1
)(
0
)(
2
(
2
)
0
)(
(
2
)
( 2
/
3
2
2
/
3
2
x
x
e
e
e
x
e
e
e
x
P
)
2
/
1
)(
0
)(
2
(
2
)
0
)(
(
2
)
( 2
/
3
2
2
/
3
2
x
x
e
e
e
x
e
e
e
x
P
e
x
e
e
e
x
e
e
e
x
P
)
3
4
(
)
2
(
2
)
( 2
/
3
2
2
2
/
3
2
2
Ahora evaluamos este polinomio en x = 0.75 para obtener
792377
.
5
)
75
.
0
)(
3
4
(
)
75
.
0
)(
2
(
2
)
75
.
0
( 2
/
3
2
2
2
/
3
2
2
e
e
e
e
e
e
e
P ,
tenemos que para 75460
.
5
)
75
.
0
( 75
.
1
e
f 84147
.
0
, por lo que el error relativo
cometido es
Er = %
66
.
0
100
75460
.
5
79238
.
5
75460
.
5
100
*
p
p
p
7. Guía de estudio Matemática V
25
ACTIVIDAD No. 8
1. Usando los siguientes datos, calcúlese f(2) con un polinomio de interpolación
de Lagrange de segundo orden.
x 1 4 5 6
f(x) 0.000 0000 1.386 2944 1.609 4379 1.791 7595
Sugerencia: Tome los puntos x0 = 1, x1 = 4, x3 = 6.
2. Queremos hallar el valor de la función )
(
)
( x
sen
x
f para 1
x usando un
polinomio interpolador de Lagrange de grado 2.
(Tome los puntos x0 = 0, x1 = 0.75, x2 = 1.5 y compare con el ejercicio resuelto
en clase)
3. .Dados los datos:
x 1.6 2 2.5 3.2 4 4.5
f(x) 2 8 14 15 8 2
a) Calcule f(2.8) con un polinomio de interpolación de Lagrange de orden 2,
tomando los puntos x1 = 2, x3 = 3.2, x5 = 4.5.
b) Calcule f(2.8) con un polinomio de interpolación de Lagrange de orden 3,
tomando los puntos x1 = 2, x2 = 2.5, x4 = 4 , x5 = 4.5.
4. Los datos siguientes muestran la relación entre la temperatura y la presión de
un fluido.
T 10 20 30 40 50 ºF
P 0.5 1.7 3.4 5.7 8.4 Psia
a) Usando un polinomio interpolador de Lagrange de grado 1 encuentre una
formula que relacione la presión con la temperatura. Determine la presión a
una temperatura de 35 ºF. (Tome los puntos T1 = 20, T3 = 40)
b) Repita la parte (a) usando un polinomio interpolador de Lagrange de grado
2. (Tome los puntos T1 = 20, T2 = 30, T3 = 40)
Grafique e Interprete los resultados.
5. En los ejercicios 1-4, ajuste mediante un polinomio interpolador de Newton con
diferencias divididas y compare los resultados.
8. Guía de estudio Matemática V
26
3.2. AJUSTE DE CURVAS POR MINIMOS CUADRADOS
El día de Año Nuevo de 1801, el astrónomo italiano Giuseppe Piazzi descubrió el
asteroide Ceres. Fue capaz de seguir su órbita durante 40 días. Durante el curso
de ese año, muchos científicos intentaron estimar su trayectoria con base en las
observaciones de Piazzi (resolver las ecuaciones no lineales de Kepler de
movimiento es muy difícil). La mayoría de evaluaciones fueron inútiles; el único
cálculo suficientemente preciso para permitir a Zach, astrónomo alemán,
reencontrar a Ceres al final del año fue el de un Carl Friedrich Gauss de 24 años
(los fundamentos de su enfoque ya los había plantado en 1795, cuando aún tenía
18 años). Pero su método de mínimos cuadrados no se publicó hasta 1809,
apareciendo en el segundo volumen de su trabajo sobre mecánica celeste,
Theoria Motus Corporum Coelestium in sctionibus conicis solem ambientium.
Mínimos cuadrados es una técnica de optimización matemática que, dada una
serie de mediciones, intenta encontrar una función que se aproxime a los datos
minimizando la suma de cuadrados de las diferencias ordenadas (llamadas
residuos) entre los puntos generados por la función y los correspondientes en los
datos.
Un requisito implícito para que funcione el método de mínimos cuadrados es que
los errores de cada medida estén distribuidos de forma aleatoria. El teorema de
Gauss-Markov prueba que los estimadores mínimos cuadráticos carecen de sesgo
y que el muestreo de datos no tiene que ajustarse, por ejemplo, a una distribución
normal. También es importante que los datos recogidos estén bien escogidos,
para que permitan visibilidad en las variables que han de ser resueltas (para dar
más peso a un dato en particular, véase mínimos cuadrados ponderados).
3.2.1. Mínimos cuadrados y análisis de regresión lineal:
El ejemplo mas simple de una aproximación por mínimos cuadrados es ajustar
una línea recta a un conjunto de observaciones definidas por puntos:
)
,
(
,
),
,
(
),
,
( 2
2
1
1 n
n y
x
y
x
y
x . La expresión matemática para la línea recta es
bx
a
y
Donde los coeficientes a y b son que representan la pendiente y la intersección
con el eje y respectivamente. ε es el error o diferencia entre el modelo y las
observaciones. Así el error o residuo puede expresarse como:
bx
a
y
Luego la suma de los cuadrados de dichas desviaciones estaría dada por:
n
i
i
i
n
i
r bx
a
y
S
1
2
1
2
)
(
9. Guía de estudio Matemática V
27
La obtención de los valores de los coeficientes, tales que esta suma sea mínima
es un problema que se puede resolver recurriendo a la derivación parcial de la
función en términos de a y b e igualando a cero:
0
)
(
2
)
1
(
)
(
2
1
1
n
i
i
i
n
i
i
i
r
bx
a
y
bx
a
y
a
S
n
i
i
n
i
i
n
i
n
i
i
n
i
i y
b
x
na
x
b
a
y
1
1
1 1
1
0 (1)
0
)
(
2
)
(
)
(
2
1
1
i
n
i
i
i
n
i
i
i
i
r
x
bx
a
y
x
bx
a
y
b
S
n
i
i
i
n
i
i
n
i
i
n
i
n
i
i
i
n
i
i
i y
x
b
x
a
x
x
b
x
a
y
x
1
1
2
1
1 1
2
1
0 (2)
De esta forma se obtienen dos ecuaciones llamadas ecuaciones normales del
modelo que pueden ser resueltas por cualquier método.
Escribiendo el sistema de ecuaciones en forma matricial tenemos:
n
i
i
i
n
i
i
n
i
i
n
i
i
n
i
i
y
x
y
b
a
x
x
x
n
1
1
1
2
1
1 ;
2
1
1
2
1
2
1
1
)
det(
n
i
i
n
i
i
n
i
i
n
i
i
n
i
i
x
x
n
x
x
x
n
A
Si usamos la regla de Cramer:
2
1
1
2
1
1
1
2
1
1
2
1
1
1
)
det(
n
i
i
n
i
i
n
i
i
i
n
i
i
n
i
i
n
i
i
n
i
i
n
i
i
i
n
i
i
n
i
i
x
x
n
y
x
x
x
y
A
x
y
x
x
y
a
2
1
1
2
1
1
1
1
1
1
)
det(
n
i
i
n
i
i
n
i
i
n
i
i
n
i
i
i
n
i
i
i
n
i
i
n
i
i
x
x
n
y
x
y
x
n
A
y
x
x
y
n
b
10. Guía de estudio Matemática V
28
2
2
2
x
x
n
xy
x
x
y
a ;
2
2
x
x
n
y
x
xy
n
b
Otra forma de calcular los coeficientes es a partir de las medias aritméticas de las
observaciones:
n
x
x
;
n
y
y
, x
b
y
a
;
2
2
x
n
x
y
x
n
xy
b
Se debe tener presente la diferencia entre el valor obtenido con la ecuación de
regresión y el valor de Y observado. Mientras es una estimación y su bondad en la
estimación depende de lo estrecha que sea la relación entre las dos variables que
se estudian. Esta diferencia se conoce como error en la estimación, este error se
puede medir a partir de la Desviación estándar de la estimación:
2
n
Sr
Sxy , Donde
n
i
i
i
r bx
a
y
S
1
2
)
(
Como esta medida trata de resumir la disparidad entre lo observado y lo estimado,
es decir, trata de medir la diferencia promedio entre lo observado y lo estimado ó
esperado de acuerdo al modelo, puede considerarse como un indicador del grado
de precisión con que la ecuación de regresión, describe la relación entre las dos
variables. No es posible comparar con las relaciones de variables dadas en
distinta unidad de medida. Es necesario entonces calcular una medida que
interprete o mida mejor el grado de relación entre las variables:
Coeficientes de determinación y de correlación:
El coeficiente de determinación es la relación entre la variación explicada y la
variación total. Este Coeficiente de correlación mide la fuerza de la relación entre
las variables. Su valor siempre estará 0 < r < 1
t
r
t
S
S
S
r
2
; donde t
S es el error residual asociado con la variable dependiente
antes de la regresión. Una presentación alternativa es la siguiente:
2
2
2
2
y
y
n
x
x
n
y
x
xy
n
r
Criterios:
0 a 0.2 Correlación muy débil, despreciable
0.2 a 0.4 Correlación débil. baja
0.4 a 0.7 Correlación moderada
11. Guía de estudio Matemática V
29
0.7 a 0.9 Correlación fuerte, alta, importante
0.9 a 1.0 Correlación muy fuerte, muy alta
La correlación entre los valores de dos variables es un hecho. El que lo
consideremos satisfactorio o no, depende de la interpretación. Otro problema que
representa la correlación es cuando se pregunta si una variable, de algún modo
causa o determina a la otra. La correlación no implica causalidad. Si las variables
x e y están correlacionadas, esto puede ser por que x causa a y, o porque y causa
a x o porque alguna otra variable afecta tanto a x como y, o por una combinación
de todas estas razones; o puede ser que la relación sea una coincidencia.
Ejemplo:
Se toma una muestra aleatoria de 8 ciudades de una región geográfica de 13
departamentos y se determina por los datos del censo el porcentaje de graduados
en educación superior y la mediana del ingreso de cada ciudad, los resultados son
los siguientes:
% de Graduados (x): 7.2 6.7 17.0 12.5 6.3 23.9 6.0 10.2
Mediana Ingreso (y): 4.2 4.9 7.0 6.2 3.8 7.6 4.4 5.4
x y xy x2 y2 ŷ 2
)
ˆ
( y
y
1 7.2 4.2 30.24 51.84 17.64 4.6133 0.1708
2 6.7 4.9 32.83 44.89 24.01 4.5109 0.1514
3 17.0 7.0 119.00 289.00 49 6.6201 0.1443
4 12.5 6.2 77.50 156.25 38.44 5.6986 0.2514
5 6.3 3.8 23.94 39.69 14.44 4.429 0.3956
6 23.9 7.6 181.64 571.21 57.76 8.033 0.1875
7 6.0 4.4 26.40 36.00 19.36 4.3676 0.001
8 10.2 5.4 55.08 104.04 29.16 5.2276 0.0297
89.8 43.5 546.63 1292.92 249.81 1.3317
8
.
89
x , 5
.
43
y , 63
.
546
xy , 92
.
1292
2
x , 81
.
249
2
y
3317
.
1
)
ˆ
( 2
y
y
1389
.
3
)
8
.
89
(
92
.
1292
8
63
.
546
8
.
89
92
.
1292
5
.
43
2
2
2
2
x
x
n
xy
x
x
y
a
20477
.
0
)
8
.
89
(
92
.
1292
8
5
.
43
8
.
89
63
.
546
8
2
2
2
x
x
n
y
x
xy
n
b
12. Guía de estudio Matemática V
30
Por tanto la ecuación de regresión nos queda:
x
y 20477
.
0
1389
.
3
ˆ
Esta ecuación permite estimar el valor de ŷ para cualquier valor de x, por ejemplo:
Una ciudad que tiene un porcentaje de graduados a nivel superior del 28% la
mediana de ingreso para la ciudad será:
87246
.
8
)
28
(
20477
.
0
1389
.
3
ˆ
y
La suma de los cuadrados de dichas desviaciones y la Desviación estándar de la
estimación esta dada por:
3317
.
1
)
(
1
2
n
i
i
i
r bx
a
y
S , 4711
.
0
2
8
3317
.
1
2
n
Sr
Sxy
El coeficiente de correlación:
)
)
5
.
43
(
81
.
249
8
)(
)
8
.
89
(
92
.
1292
8
(
5
.
43
8
.
89
63
.
546
8
2
2
2
2
2
2
y
y
n
x
x
n
y
x
xy
n
r
9485
.
0
r
Se observa que la correlación entre los valores de las dos variables es muy fuerte.
0
1
2
3
4
5
6
7
8
9
0 5 10 15 20 25 30
Observaciones
y=a+bx
Grafica de dispersión elaborada en Excel
EXCEL - fx-570ES ó 991 ES
En el apéndice 5 se muestra la hoja de cálculo en EXCEL y se explica como
trabajar en la calculadora con el modo de REGRESION LINEAL.
13. Guía de estudio Matemática V
31
ACTIVIDAD No. 9
1. Los datos siguientes muestran la relación entre la temperatura y la presión de
un fluido. Usando regresión lineal encuentre una formula que permita
determinar la presión a una temperatura de 35:
T 10 20 30 40 50 60 70
P 0.5 2.5 2.0 4.0 3.5 6.0 5.5
Calcule la desviación estándar de la estimación y el coeficiente de correlación.
Grafique e Interprete los resultados.
2. Demuestre que los datos que se indican a continuación no se ajustan a una
línea recta.
x 1 2 3 4 5 6 7
y 32 11.7 6.8 5 8.3 23 43
Calcule la desviación estándar de la estimación y el coeficiente de correlación.
Grafique e Interprete los resultados.
3. Se quiere resolver un problema de hipótesis relacionado con la caída del
paracaidista de la actividad No. 5, en la cual se dio el siguiente modelo
matemático teórico:
t
m
c
e
c
gm
t
v 1
)
( donde m=98.1 Kg, g=9,8 m/s2 y el coeficiente de
arrastre c=12.5 kg/s.
Un modelo empírico alternativo para la velocidad del paracaidista esta dado
por:
t
t
c
gm
t
v
75
.
3
)
(
Compruebe la veracidad de esos modelos matemáticos. Esto podría hacerse al
medir la velocidad real del paracaidista con valores conocidos del tiempo y
comparar estos resultados con las velocidades predichas por cada modelo.
Velocidades medidas del paracaidista en m/s
x 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
y 10 16.3 23 27.5 31 35.6 39 41.5 42.9 45 46 45.5 46 49 50
Calcule la desviación estándar de la estimación y el coeficiente de correlación.
Grafique e Interprete los resultados.
14. Guía de estudio Matemática V
32
3.2.2. Regresión Polinomial:
En muchos casos una curva es más adecuada para ajustar los datos. El
procedimiento de mínimos cuadrados puede extenderse fácilmente para ajustar un
polinomio de grado superior un conjunto de observaciones definidas por puntos:
)
,
(
,
),
,
(
),
,
( 2
2
1
1 n
n y
x
y
x
y
x . Por ejemplo, supongamos que ajustamos un
polinomio de segundo grado o cuadrático:
2
cx
bx
a
y
Donde los coeficientes a, b y c son lo coeficientes a determinar y ε es el error o
diferencia entre el modelo y las observaciones. En este caso el error o residuo
puede es:
2
cx
bx
a
y
Luego la suma de los cuadrados de dichas desviaciones estaría dada por:
n
i
i
i
i
n
i
r cx
bx
a
y
S
1
2
2
1
2
)
(
Recurriendo a la derivación parcial de la función en términos de a, b y c e
igualando a cero:
0
)
(
2
1
2
n
i
i
i
i
r
cx
bx
a
y
a
S
0
)
(
2
1
2
i
n
i
i
i
i
r
x
cx
bx
a
y
b
S
0
)
(
2 2
1
2
i
n
i
i
i
i
r
x
cx
bx
a
y
c
S
De esta forma se obtienen tres ecuaciones normales del modelo.
n
i
i
n
i
i
n
i
i y
c
x
b
x
na
1
1
2
1
(1)
n
i
i
i
n
i
i
n
i
i
n
i
i y
x
c
x
b
x
a
x
1
1
3
1
2
1
(2)
n
i
i
i
n
i
i
n
i
i
n
i
i y
x
c
x
b
x
a
x
1
2
1
4
1
3
1
2
(3)
15. Guía de estudio Matemática V
33
Escribiendo el sistema de ecuaciones en forma matricial tenemos:
n
i
i
i
n
i
i
i
n
i
i
n
i
i
n
i
i
n
i
i
n
i
i
n
i
i
n
i
i
n
i
i
n
i
i
y
x
y
x
y
c
b
a
x
x
x
x
x
x
x
x
n
1
2
1
1
1
4
1
3
1
2
1
3
1
2
1
1
2
1
Resolviendo se obtienen los coeficientes a, b y c.
Desviación estándar de la estimación:
3
n
Sr
Sxy , Donde
n
i
i
n
i
i
i
i
r y
y
cx
bx
a
y
S
1
2
1
2
2
)
ˆ
(
)
(
Coeficientes de determinación y de correlación:
El coeficiente de determinación es la relación entre la variación explicada y la
variación total. Su valor siempre estará 0 < r < 1
t
r
t
S
S
S
r
2
; donde t
S es el error residual asociado con la variable dependiente
antes de la regresión
n
I
t y
y
S
1
2
)
( .
Este Coeficiente de correlación mide la fuerza de la relación entre las variables.
t
r
t
S
S
S
r
Ejemplo:
Los datos siguientes muestran la relación entre la distancia recorrida (m) y la
velocidad alcanzada por un cuerpo (m/s2). Usando regresión polinomial encuentre
una formula que permita determinar la velocidad a una distancia de 4.5 m:
x 0 1 2 3 4 5
v 2.1 7.7 13.6 27.2 40.9 61.1
Calcule la desviación estándar de la estimación y el coeficiente de correlación.
Grafique e Interprete los resultados.
Solución:
16. Guía de estudio Matemática V
34
x y xy x2 x2y x3 x4
0 0 2,1 0 0 0 0 0
1 1 7,7 7,7 1 7,7 1 1
2 2 13,6 27,2 4 54,4 8 16
3 3 27,2 81,6 9 244,8 27 81
4 4 40,9 163,6 16 654,4 64 256
5 5 61,1 305,5 25 1527,5 125 625
15 152,6 585,6 55 2488,8 225 979
15
x
, 6
.
152
y
, 6
.
585
xy
, 55
2
x
, 8
.
2488
2
y
x
,
225
3
x
, 979
4
x
Escribiendo el sistema de ecuaciones en forma matricial tenemos:
n
i
i
i
n
i
i
i
n
i
i
n
i
i
n
i
i
n
i
i
n
i
i
n
i
i
n
i
i
n
i
i
n
i
i
y
x
y
x
y
c
b
a
x
x
x
x
x
x
x
x
n
1
2
1
1
1
4
1
3
1
2
1
3
1
2
1
1
2
1
8
.
2488
69
.
585
6
.
152
979
225
55
225
55
15
55
15
6
c
b
a
Resolviendo este sistema de ecuaciones se tiene a = 2.47857 , b = 2.35929 , c
= 1.86071
Por tanto la ecuación de regresión es:
2
86071
.
1
35929
.
2
47857
.
2
ˆ x
x
y
El valor de la velocidad ŷ estimado para x = 4.5 m es:
775
.
50
)
5
.
4
(
86071
.
1
)
5
.
4
(
35929
.
2
47857
.
2
ˆ 2
y m/s
Calculando el error residual asociado con la variable dependiente antes de la
regresión y la suma de los cuadrados de las desviaciones:
n
I
t y
y
S
1
2
)
( ;
n
i
i
r y
y
S
1
2
)
ˆ
(
17. Guía de estudio Matemática V
35
ŷ 2
)
( y
y 2
)
ˆ
( y
y
1 2,4786 544,4444 0,14334
2 6,6986 314,4711 1,0028
3 14,64 140,0278 1,0816
4 26,3029 3,1211 0,80479
5 41,6871 239,2178 0,61953
2513,3933 3,74637
833
.
2513
r
S ; 74637
,
3
r
S
Desviación estándar de la estimación:
1175
.
1
3
6
74637
.
3
3
n
Sr
Sxy
Coeficientes de determinación y de correlación:
99851
.
0
933
.
2513
74637
.
3
933
.
2513
2
t
r
t
S
S
S
r
99925
.
0
r
Se observa la correlación entre los valores de dos variables es muy fuerte.
0
10
20
30
40
50
60
70
0 2 4 6
Observaciones
y=a+bx+cx2
Grafica de dispersión elaborada en Excel
EXCEL - fx-570ES ó 991 ES
En el apéndice 6 se muestra la hoja de cálculo en EXCEL y se explica como
trabajar en la calculadora con el modo de REGRESION POLINOMIAL.
18. Guía de estudio Matemática V
36
ACTIVIDAD No. 10
1. Emplee la regresión por mínimos cuadrados para ajustar a una línea recta:
x 1 2 3 4 5 6 7 8 9
y 1 1.5 2 3 4 5 8 10 13
a) Además de la pendiente y la intersección, calcule el error estándar de la
estimación y el coeficiente de correlación. Grafique los datos y la línea recta.
Evalúe el ajuste.
b) Vuelva a hacer el cálculo del inciso (a), pero usando regresión polinomial
para ajustar los datos a una parábola. Compare los resultados con los
obtenidos en (a)
2. Los datos siguientes representan el crecimiento bacterial en un cultivo líquido
durante cierto número de días.
dia 0 4 8 12 16 20
cantidad x10-6 67 84 98 125 149 185
Encuentre la ecuación de mejor ajuste (recta o parábola) a la tendencia de
datos. Grafique en cada caso e interprete los resultados. Pronostique la
cantidad de bacterias después de 40 días.
3. Un objeto se suspende en un túnel de viento y se mide la fuerza para varios
niveles de velocidad del viento. A continuación están tabulados los resultados
v (m/s) 10 20 30 40 50 60 70 80
F (N) 25 70 380 550 610 1220 830 1450
Encuentre la ecuación de mejor ajuste (recta o parábola) a la tendencia de
datos. Grafique en cada caso e interprete los resultados.
4. Usando regresión polinomial para ajustar a una parábola los datos del ejercicio
No 2 de la actividad No 9. Compare los resultados con los obtenidos
anteriormente.
5. Diseñe hojas de cálculo para aplicar la regresión lineal y la polinomial. Tome
algunos de los ejercicios propuestos y varíe algún o varios de los valores de y.
Anote sus observaciones con respecto al cambio de la desviación estándar y el
coeficiente de correlación. ¿Ofrecerá en estos casos la ecuación de regresión
un ajuste adecuado?