Se genera un pronostico mediante MRLM en el lenguaje de programación R. aplicada a dos bases de Datos: una sobre ganancias de una empresa y otra de temperaturas de una ciudad.
Aplicación de Modelos de Regresión Lineal Múltiple para el Análisis de Bases de Datos Longitudinales
1. sg
# Diagrama de lineas por trimestre para cinco años consecutivos
par(bg=7) ; ciclo= max(cycle(DatosTS)) ; inicio=c(1960,1) ; fin=c(1965,4)
matplot( matrix( window( DatosTS, inicio, fin), nrow = ciclo) ,
lwd=2, xlab=“Trimestre", ylab=" Índice de Ganancia", type="l", lty=1)
Titulo = "Movimiento bursatil de empresa J&J n Período de 1960 a 1965"
title(Titulo, sub="Grafico de Líneas Múltiple")
Aplicación del Modelo de Regresión Lineal Múltiple para el Ajuste y Prónostico de Bases
de Datos Longitudinales Disponibles en Línea, Según Área del Quehacer Científico.
Con el avance de las tecnologías de la información y
la comunicación, se generan bases de datos que se
actualizan y están disponibles en línea, como
resultado del interés de las instituciones de recolectar
y organizar la información y como propuestas del
acuerdo de los países respecto de la estandarización
en los distintos ámbitos del desarrollo humano, en las
áreas de las ciencias biológicas, de salud,
epidemiológicas, sociales, económicas y financieras.
Se propone el uso de modelos de regresión lineal
múltiple (MRLM), la construcción de polinomios y la
resolución de sistemas de ecuaciones lineales (SEL)
de la forma AX=b para analizar, describir, modelizar y
pronósticar bases de datos longitudinales dinámicas.
¿Puede un investigador, analizar datos longitudinales
de interés propio, a través de procedimientos fáciles
de seguir en un programa de computación adecuado?
Objetivo General
Aplicar un Modelo de Regresión Lineal Múltiple
para el Ajuste y Pronóstico de Bases de Datos
Longitudinales disponibles en Línea, Según el
Área del Quehacer Científico
Objetivos Específicos
Dilucidar el Comportamiento de las Variables
que se Identifican en Bases de Datos
Obtenidas, por factores temporales.
Realizar modelización y Pronóstico de Series de
Tiempo, a través del Modelo de Regresión
Lineal Múltiple con Aplicación de Software Libre.
y = nottem # Datos de temperatura de Nottingham mensual de 1920 a 1940.
?nottem ; str(nottem) ; par(bg="SkyBlue") # Información y estructura de BD
jet.colors <- colorRampPalette( c("blue", "orange" , "red") )
boxplot(y ~ cycle(y), col= c(jet.colors(5.5), rev(jet.colors(5.5))),
names= month.abb, ylab="Grados Fahrenheit", xlab = "Meses de aquella época")
title("Temperaturas ambientales de Nothingham de 1920 a 1935")
# ¿Qué grado m sugiere el comportamiento de este diagrama de cajas?.
UNIVERSIDAD NACIONAL AUTÓNOMA DE NICARAGUA, LEÓN
FACULTAD DE CIENCIAS Y TECNOLOGÍA
DEPARTAMENTO DE MATEMÁTICA Y ESTADÍSTICA
Autor: Lic. Mynor Ríos.
mitrab.gob.ni Data Bank UNICEF
UNdata Medio Ambiente/Data
2
Modelo polinómico ajustado:
Y = 3,59237 + 0,65487*(Año-1970) + 0,0435*(Año-1970)2
-0,31*(Trim-2,5)2 - 0,0877*(Trim-2.5)3
# La Calidad del modelo ajustado es R2 = 0.9732.
# Matriz de Diseño en las Regresoras de Tiempo,Variable Respuesta es Y.
Y = JohnsonJohnson ; At = trunc(time(Y)) ; Bt = cycle(Y) # Bt es Trimestre
A = mean(At) ; A1 = At-A ; A2 = A1*A1 ; A3 = A1*A2 ; A4 = A2*A2
B = mean(Bt) ; B1 = Bt-B ; B2 = B1*B1 ; B3 = B1*B2 ; B4 = B2*B2
# MRLM de grado 2 en At y grado 3 en Bt y Prediccion a 3 años
modelo = lm(Y ~ A1+A2+B2+B3) ; d = modelo$coef ; summary (modelo)
f = function(a, b) d[1]+d[2]*a+d[3]*a^2+d[4]*b^2+d[5]*b^3
Ap=1981:1983; PY=outer(Ap-A, 1:4-B, f); dimnames(PY)=list(Ap, 1:4); PY
Ahora veamos cómo plantear y resolver las Ecuaciones Normales por Matrices
X = cbind(X0 = 1, A1, A2, B2, B3) ; XX = t(X) %*% X ; XY = t(X) %*% Y
XX ; XY ; solve(XX, XY) # Solución del SEN, Coeficientes del modelo.
# Al ajustar el MRLM a Log10(Y), resulta R2=0,9837, con los grados n=1 y m=2.
“Un día al otro día pronuncia sabiduría, y una noche a la otra noche transmite conocimiento” Salmo 19.2
PORTALES WEB RECOMENDADOS
MODELIZACIÓN DE DATOS FINANCIEROS
CONCLUSIONES
EXPLORACIÓN DE DATOS FINANCIEROS DESCRIPCION DE DATOS ATMOSFÉRICOS
INTRODUCCIÓN
METODOLOGIA Y RECURSOS
OBJETIVOS
?JohnsonJohnson ; str(JohnsonJohnson) # Información y estructura de BD
DatosTS = JohnsonJohnson ; par(bg=7) # Grafico de la serie de tiempo
plot(DatosTS, type="s", col=6, xlab="Años", ylab="indice de ganancia")
lines(DatosTS, type="h", col=4) ; grid(col=3) # Añadir barras al gráfico
titulo = title("Movimiento bursátil de empresa J&J“, sub=“Grafico de S.T.")
write.csv(DatosTS, "BD.csv") # Se exporta DatosTS hacia Excel (.csv)
MisDatos = read.csv(“BD.csv") ; str(MisDatos) # Importar BD (.csv)
Este estudio es cuantitativo, predictivo, longitudinal
y retrospectivo; La información a recolectar es
mediante la obtención de bases de datos en línea,
tales como: mitrab.gob.ni, Yahoo.finance y GBD.net.
Para generar los resultados se aplica el lenguaje
de programación y ambiente R. Se analiza un
problema de aplicación de forma exhaustiva y otro
problema a nivel descriptivo.
Modelo de Regresión Lineal Múltiple propuesto:
Yt = a0 + ∑ ai·(At – Α)^i + ∑ bj·(Bt – Β)^j + εt
Grado Polinómico de cada sumatoria: n m
Coeficientes del modelo: a0 ai bj
At: Año(t) Bt: Períodos del Año(t)
A: Promedio de At B: Promedio de Bt
εt: Residuo o Error Aleatorio al Período(t)
Sistema de Ecuaciones Normales: (Xt·X)·β = (Xt·Y)
Años
indicedeganancia
1960 1965 1970 1975 1980
051015
Movimiento bursátil de empresa J&J
Grafico de S.T.
1.0 1.5 2.0 2.5 3.0 3.5 4.0
0.40.60.81.01.21.4
Trimestre
ÍndicedeGanancia
Movimiento bursatil de empresa J&J
Período de 1960 a 1965
Grafico de Lineas Múltiple
Para el cálculo a mano, los Modelos de Regresión
Lineal Múltiple, pueden resolverse por cálculos
aritméticos básicos en SEL, y no requieren de
transformaciones como logaritmos o exponenciales.
Al trabajar a mano con datos centrados, los
Sistemas de Ecuaciones Normales kxk pueden
reducirse a SEL de orden 3x3, 2x2 y 1x1.
Tecnología: La disponibilidad de software libre, con
librerías actualizadas, facilitan la gestión y
procesamiento de bases de datos transversales y
longitudinales que responden a problemas reales y
apoyan a la toma de decisiones eficaz.
El Análisis de Datos y los Modelos Matemáticos y
Estadísticos son herramientas potentes con las que
puede contar un profesional, analista o investigador.
Sistema de Ecuaciones Normales Sistemas de Ecuaciones Lineales Beta Estimado
Xt
X X0 A1 A2 B2 B3 Beta Xt
Y
X0 84 0 3080 105 0 X0 403,18
A1 0 3080 0 0 0 A1 2017,03
A2 3080 0 202664 3850 0 A2 18686,29
B2 105 0 3850 215,25 0 B2 477,935
B3 0 0 0 0 479,0625 B3 -42,005
SEL1 X0 A2 B2 Coef. Lado derecho
X0 84 3080 105 X0 403,18
A2 3080 202664 3850 A2 18686,29
B2 105 3850 215,25 B2 477,935
SEL2: 3080*A1 = 2017.03
SEL3: 479.0625*B3 = -42.005
X0 3,59237
A1 0,65487
A2 0,04350
B2 -0,31000
B3 -0,08770
cran.r-project.org www.r-project.org