4. Ing. Frandell Hernández
Regresión Lineal Simple
En un modelo de regresión lineal que explica la
relación que existe entre la variable respuesta Y
(conocida como dependiente) con respecto a un
conjunto variables independientes X. En un modelo
matemático
Diagrama de dispersión
Consiste en la representación grafica de dos
variables para un conjunto de datos, estas se
representan como un punto en el plano
cartesiano.
El modelo de regresión lineal simple tiene la
siguiente expresión:
Donde:
a: es la ordenada en el origen (valor de Y cuando
X=0)
b= es la pendiente de la recta
e= es una variable que incluye un conjunto grande
de factores que influye en la respuesta en una
pequeña magnitud se le denomina error.
X y Y: son variables aleatorias.
5. Método de los mínimos cuadrados
Es un método matemático que permite resolver y
obtener la ecuación de regresión lineal, el cual
ayuda en la predicción y aproximación de
parámetros.
Formula del error cuadrático
𝐸2 𝑓 =
1
𝑛
𝑘=1
𝑛
𝑓(𝑋𝑘 − 𝑌𝑘
2
1
2
Ecuación normal de Gauss
𝐴
𝑘=1
𝑛
(𝑋𝑘)2
+𝐵
𝑘=1
𝑛
(𝑋𝑘) =
𝑘=1
𝑛
(𝑋𝑘𝑌𝑘)
𝐴
𝑘=1
𝑛
𝑋𝑘 + 𝑁𝐵 =
𝑘=1
𝑛
𝑌𝑘
A y B = son los valores estadísticos de la ecuación
N= numero de muestras obtenidas
N Xk Yk Xk^2 XkYk
n1
n2
𝑛 𝑋𝑘 𝑌𝑘 𝑋𝑘2 𝑋𝑘Yk
La siguiente tabla indica la ubicación de a cada
elemento
Ing. Frandell Hernández
6. Coeficiente de determinación:
𝑅2
=
𝑘=1
𝑛
𝑌𝑘 − 𝑌
2
𝑘=1
𝑛
( 𝑌𝑘 − 𝑌𝑘)^2
0 ≤ 𝑅2
≤ 1
Si el resultado se acerca a 1 indica que
este describe mejor los datos
experimentales
𝑌: 𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜 𝑑𝑒 𝑙𝑜𝑠 𝑣𝑎𝑙𝑜𝑟𝑒𝑠 𝑑𝑒 𝑋𝑘 𝑌 =
𝑋𝑘
𝑛
𝑌: 𝑒𝑐𝑢𝑎𝑐𝑖𝑜𝑛 𝑑𝑒 𝑙𝑎 𝑟𝑒𝑔𝑟𝑒𝑠𝑖ó𝑛 𝑙𝑖𝑛𝑒𝑎𝑙 𝑌 = AX + B
Ing. Frandell Hernández
7. Error estándar en la estimación:
Es la desviación estándar de la distribución muestral de un estadístico. Mide la variabilidad
o dispersión de los valores observados alrededor de las rectas de regresión. La Formula es
la siguiente
𝑆𝑒 =
𝑦2𝑖 − 𝑏 𝑦1 − 𝑎 𝑋𝑖𝑌𝑖
𝑛 − 2
Ing. Frandell Hernández
8. Razones para usar el análisis de
regresión lineal
•1. Versatilidad y aplicabilidad
•2. Es más fácil de comunicar
•3. Brinda una mejor comprensión de las estadísticas
Ventajas
•Es un método fácil y simple de implementar en comparación
a otros.
•En el sistema de regresión lineal es el mejor algoritmo para
determinar en los análisis los posibles resultados futuros.
•Aunque la regresión lineal tiene una gran susceptibilidad a los
pre-ajustes, hay técnicas que nos permiten reducir la
dimensionalidad a través de las fórmulas que mencionamos
antes.
Desventajas
•En caso de encontrar valores atípicos los efectos que se
pueden tener en la regresión lineal son considerables.
•El principal problema de la regresión lineal es que
asume una relación de dependencia entre las dos
variables.
•Ya que no existe una sola variable que pueda afectar
una descripción completa, la regresión lineal no es un
análisis completo de relaciones entre diferentes
variables.
Ing. Frandell Hernández
9. Consideraciones a Tomar.
•Considerar el número de casos válidos, así como la media y la desviación estándar.
•Deberás tomar en cuenta los diagramas de dispersión, así como gráficos parciales y los de
probabilidad normal e histogramas.
•Todas las variables deben ser cuantitativas. Es decir, si una variable es categórica, esta debe
codificarse para volverse variable.
•Todas las variables independientes deben tener una distribución normal de la variable
dependiente.
Hipótesis de Regresión Lineal.
•Las variables pueden y deben medirse de manera continuada, ya que algunas
variables son continuas en el tiempo, como las ventas, el peso y las puntuaciones.
•Realiza y utiliza diagramas de dispersión para comprobar que hay una relación lineal
entre las dos variables.
•No debe existir ningún tipo de dependencia entre las observaciones.
•Comprueba la homocedasticidad, concepto estadístico donde las variables de la línea
de regresión lineal tienen un ajuste adecuado a lo largo de toda la línea.
Ing. Frandell Hernández
10. Es un modelo estadístico versátil con el que se evalúa las relaciones entre un destino continuo y los
predictores. Este tipo se presenta cuando dos o más variables independientes influyen sobre una variable
dependiente Ejemplo: Y = f(x, w, z)..
Deben ser escalares (numérica), ordinales (también se recomienda con más de 5
categorías), variables de dos categorías donde una indica existencia o otra no-
existencia.
Debe ser escalar (numérica) o bien ordinal de más
de 5 categorías, es decir, las categorías de la variable
dependiente deben tener un orden interno o jerarquía
Ejemplo:
Nivel de ingresos, número de hijos, justificación para no tener
hijos, en una escala de 1-nunca a 10-siempre.
Ejemplo:. 1-ser soltero, 0-no ser soltero).
11. Los dos siguientes pasos hacen
referencia a la influencia de cada una de las
variables independientes:
Si es menor de 0,05 es que el modelo es
estadísticamente significativo y por tanto las
variables independientes explican “algo” la
variable dependiente, cuánto “algo” es la R-
cuadrado
Es cuánto las variables independientes
explican la variable dependiente, indica el
porcentaje de la varianza de la variable
dependiente explicado por el conjunto de
variables independientes. Cuanto mayor sea la R-
cuadrado más explicativo y mejor será el modelo
explicativo.
Si es menor de 0,05 es que esa variable
independiente se relaciona de forma
significativa con la variable dependiente, por
tanto, influye sobre ella, es explicativa, ayuda
a predecirla
Indica la intensidad y la dirección de la relación
entre esa variable independiente (VI) y la variable
dependiente (VD):
12.
13. Mediante el siguiente problema podremos ilustrar la aplicación de Regresión Múltiple:
En la Facultad de Ingeniería de Sistemas se quiere entender los factores de aprendizaje de los alumnos que
cursan la asignatura de PHP, para lo cual se escoge al azar una muestra de 15 alumnos y ellos registran notas
promedios en las asignaturas de Algoritmos, Base de Datos y Programación como se muestran en el siguiente
cuadro.
14. El 69.70% del aprendizaje del Curso de
PHP puede ser explicado mediante las
notas obtenidas por las asignaturas de
Algoritmos, Base de Datos y
Programación.
15. q
q
Analizar los resultadosobtenidos a través de las diferentes técnicas utilizadas y
comprender su significado en términos de pronósticos futuros,para extraer
conclusiones y tomar decisiones basadas en los datos.
Precisión del pronóstico
Tendencias y patrones identificados
Factores de incertidumbre
Interpretación contextual
Toma de decisiones estratégicas
Planificación de la demanda
Optimización de la cadena de suministro
Identificación de oportunidades y amenazas
Mejora de la precisión de los pronósticos
Lcdo. José Ramírez
17. NÚMEROS ÍNDICES SIMPLES
Un indice simple es el cociente entre la magnitud en el periodo Corriente y la magnitud en el
periodo base. generalmente se multiplica por cien y se lee en porcentaje. no presentan gran utilidad en sí
mismos y su interés radica en que son el punto de partida de la construcción de los índices complejos y en
que algunas de sus propiedades sirven para evaluar la bondad de éstos. consideremos la magnitud x en
distintos períodos de tiempo. el índice simple de la magnitud x en el período t con respecto al período 0 será:
Que se interpreta como la variación, en tanto por uno, experimentada por la magnitud x entre el
periodo 0 y el periodo t. habitualmente el índice se expresa en tanto por ciento, es decir ,interpretándose
como la variación, en tanto por ciento, experimentada por la magnitud x entre el periodo 0 y el periodo t. con
todo, en los desarrollos y propiedades de los números índices ha de considerarse la primera de las
expresiones.
Los índices simples pueden recoger la evolución de los precios de un bien, de su producción
(cantidad) o de sus valores. en las figuras siguientes se ilustra el concepto construyendo el índice del precio
del dolar.
Propiedades de los números índices: las siguientes propiedades las cumplen los índices simples y,
aunque sería genial, no siempre las cumplen los índices complejos.
1. Existencia: todo número índice ha de existir, ser finito y distinto de cero.
2. Identidad: si el período base y el actual coinciden, el índice vale la unidad.
q
q
21. NUMEROS INDICE COMPLEJOS
ES BIEN SABIDO QUE CUANDO LAS VARIABLES A ESTUDIAR TIENEN LA MISMA IMPORTANCIA,
EL MÉTODO PARA EVALUARLAS ES CON LOS NÚMEROS ÍNDICE SIMPLES, ENTONCES CUANDO
LA IMPORTANCIA NO ES LA MISMA SE DEBE HACER EL ESTUDIO CON LOS NÚMEROS ÍNDICE
COMPLEJOS . SIN PERDER DE VISTA QUE LA BASE FUNDAMENTAL DE ELLOS SON LOS
PRIMEROS, (ES DECIR, LOS ÍNDICES SIMPLES)
22. Media Armónica
Media Geométrica
Media Aritmética
NÚMEROS ÍNDICE COMPLEJOS NO PONDERADOS: MEDIA SIMPLE, TIPOS DE MEDIA Y MEDIA AGREGATIVA SIMPLE
ROBERTO MENDOZA V-8.726.465
MEDIA AGREGATIVA SIMPLE
ES CUANDO SE ESTUDIA UNA
VARIABLE UNIDIMENSIONAL EN
DIFERENTES PERIODOS O
DIFERENTES VARIABES EN UN
MISMO PERIODO
23. PAASCHE
LASPEYRES FISHER
SON UTILIZADOS EN
ECONOMÍA PARA
DETERMINAR POR
EJEMPLO EL CRECIMINETO
ECONÓMICO DE UN PAÍS
TOMANDO EN CUENTA LA
INFLACIÓN EN LOS BIENES
Y SERVICIOS SU FÓRMULA
ES SIMPLE Y SE PUEDE
ESCRIBIR ASI:
𝑃𝑜 ∗ 𝐶𝑏
IL= ----------------------
𝑃𝑏 ∗ 𝐶𝑏
ES LA MEDIA ARITMÉTICA
PONDERADA DE LOS
ÍNDICES SIMPLES DE EL
ESTUDIO DE PRECIO DE
UNA SERIE DE ARTÍCULO
UTILIZANDOSE COMO
PONDERACIÓN PARA
CADA BIEN :
Wi= Pio*Qit
Pio: PRECIO DEL PERIODO BASE
Qit: CONSUMO DEL PERIODO
ACTUAL
SE DEFINE COMO LA
MEDIA GEOMÉTRICA DEL
INDICE DE LASPEYRES Y
EL DE PAASCHE
NÚMEROS ÍNDICE COMPLEJOS PONDERADOS