SlideShare una empresa de Scribd logo
1 de 29
Descargar para leer sin conexión
1
UNIVERSIDAD ABIERTA Y A DISTANCIA DE MÉXICO
DIVISIÓN DE CIENCIAS EXACTAS, INGENIERÍA Y TECNOLOGÍA
“Análisis Estadístico y Probabilístico de la Deserción Escolar del IEMSDF
mediante el Método de Regresión por Mínimos Cuadrados.”
PRESENTACION DEL PROYECTO TERMINAL PARA OBTENER
EL TÍTULO DE:
LICENCIATURA EN MATEMÁTICAS
PRESENTA EL ALUMNO SUSTENTANTE:
C. PEDRO DANIEL LARA MALDONADO
DIRIGIDA POR:
MAT. BEATRIZ CARRASCO TORRES
EVALUADA POR:
DRA. MARLEN HERNÁNDEZ ORTIZ.
ELABORADO EN LA:
CIUDAD DE MÉXICO, DISTRITO FEDERAL, 2015-2016.
2
1. Resumen
El tema de este proyecto se circunscribe a los datos registrados en el Sistema de
Información Mexicana del Distrito Federal (INFOMEXDF) dentro de la dependencia
paraestatal del Instituto de Educación Media Superior del Distrito Federal por parte de la
Dirección Estudiantil; a través del conducto de la Subdirección de Administración Escolar.
El objetivo de este proyecto es hacer predicciones de la deserción estudiantil en las últimas
generaciones que comprenden del año 2013 hasta el año 2014, considerado para toda la
dependencia; se aplicaron los modelos de ajuste de funciones polinomiales mediante el
método regresión por mínimos cuadrados para encontrar una función polinomial de ajuste a
los datos. Este ajuste se centró en el cálculo del error que define su desviación estándar con
distribución 𝑡 −student para poder construir un intervalo de predicción que representa una
estimación muestral de estudiantes desertores para las generaciones venideras; cuyos límites
de cada intervalo predicho, generó incremento en el indicador del porcentaje de deserción;
interpretándolo a corto plazo, permitió plantear una aproximación probable a la magnitud del
fenómeno de abandono estudiantil, que propuso a las autoridades competentes del IEMSDF
en promover a sus estudiantes, una estimulación de pertenencia trascendental al desarrollo
profesional.
Palabras claves: Deserción estudiantil, Análisis estadístico y Ajuste matemático.
2. Introducción
La deserción escolar en esta dependencia paraestatal del IEMS-DF es un grave problema
para el desarrollo sustentable de la población, particularmente en la entidad federativa de la
Ciudad de México (Díaz, 2015). Tal situación implica una conducta de riesgo entre sus
habitantes, como la consecuencia de gastos presupuestales y pérdidas económicas a nivel
local respecto a las oportunidades de trabajo; esto afecta a nivel familiar, en los ingresos
salariales que sustenta una mejor calidad de vida individual (Gujarati, 2012).
Por lo tanto, en la actualidad el uso de las Herramientas Matemáticas Probabilísticas ha
permitido optimizar y determinar los Procesos de los Indicadores de Desempeño en cuestión
de considerar la información a través de los datos registrados en un plantel determinado por
esta dependencia paraestatal sobre la situación de la Deserción Estudiantil del Sistema
Escolarizado cuya causa de este objetivo depende de la relación de la Cuantificación de su
Ingreso y Egreso por Generación que se analiza a través del “Modelo Estadístico del Ajuste
de Funciones mediante el Método de Regresión por Mínimos Cuadrados” ;cuyo creador fue
el matemático alemán Karl Friedrich Gauss en 1795 (Pérez, 2002), el cual permite interpretar
geométricamente sus variaciones, en efectuar y determinar la predicción certera del cálculo
de la probabilidad como variable de respuesta del pronóstico porcentual de la deserción
estudiantil que ocurra en base a la tendencia que ha seguido los datos registrados de estos
eventos a lo largo del tiempo y asimismo. Cuyo fin se considere a la situación problemática
3
de este análisis estadístico cuantitativo como argumento para que las autoridades
competentes puedan fundamentarlo como un primer paso para tomar medidas preventivas de
atención y reflexión de la importancia en corto y a largo plazo de cómo puede afectar a esta
dependencia paraestatal y buscarle una decisión alternativa a través de la instrumentación del
diseño de estrategias de acciones que pretendan involucrarlos en conocer esta información
de la situación de este fenómeno, para que así con base a esas predicciones realizadas
adviertan mejores decisiones que faciliten la viabilidad de reducir su incidencia desertora
para que sea orientada como una propuesta al fomento del incremento del egreso estudiantil
que conlleva a la dimensión del bienestar en su permanencia en el plantel.
3. Marco Teórico
3.1. Deserción Estudiantil
La deserción estudiantil es un indicador situacional de abandono del sistema escolar,
provocado por la combinación de factores que se generan en el entorno como en contextos
interpersonales (Lara, 2016).
El evento de desertar puede ocurrir en cualquier momento durante el período por
generación: por ejemplo, si un individuo deserta en la mitad del semestre que esté estudiando
y otro lo hace finalizando el semestre que estudió, la duración en la institución es diferente.
Sin embargo, en la base de datos que permitirá estimar los parámetros del modelo, la duración
será igual para dichos individuos (tres semestres), tomando así únicamente valores discretos
generacionales (1, 2, 3, ..., etc.). Entonces, la relación del flujo escolar de una generación
desertora, se define por medio de la siguiente fórmula:
𝐏𝐃𝐆 = (
𝐄𝐈𝐆 − 𝐄𝐄𝐆
𝐄𝐈𝐆
) ∗ 𝟏𝟎𝟎(Ponce, 2003) … (𝟏)
Donde:
𝐏𝐃𝐆 = Porcentaje de deserción generacional
𝐄𝐄𝐆 = Número de estudiantes que egresarón por generación
𝐄𝐈𝐆 = Número de estudiantes que ingresarón por generación
El propósito de la ecuación … (𝟏) es dar información útil y verídica, que explica
cuantitativamente el fenómeno de la deserción estudiantil en el instituto y esto contribuirá en
desarrollar un óptimo modelo matemático para el pronóstico cuantitativo, que determina el
comportamiento futuro de este indicador analítico, para diseñar estrategias de prevención y
atención a la población estudiantil que cursa este nivel educativo en la dependencia.
3.2 Análisis estadístico
Es importante considerar a la Estadística como una herramienta de apoyo que puede dar
respuesta a muchas de las necesidades que la actual sociedad plantea, a razón de que su tarea
fundamental es la reducción de datos, con el objetivo de representar la realidad y describirla,
4
predecir su futuro o simplemente conocerla; en nuestros días se ha convertido en una rama
de la matemática efectiva para describir con exactitud los valores de datos físicos, políticos
y sociales que sirve para relacionar y analizar dichos datos. Esto implica que esta herramienta
no consiste sólo en resumir y tabular los datos, sino en enfocarse en el proceso de
interpretación de esta información (Levin, 2004).
Es importante considerar que Pronosticar o dar aproximaciones a futuros eventos ha sido
una práctica frecuente para los seres humanos. En tiempos remotos estos pronósticos se
realizaban mediante métodos un poco ortodoxos. Con el paso del tiempo y gracias a los
avances teóricos y tecnológicos de la ciencia, estas aproximaciones han ido cambiando hasta
llegar a metodologías rigurosamente científicas y bien fundamentadas teóricamente
(Cannavos, 1988).
Con esto decimos que el desarrollo de la Teoría de la Probabilidad ha aumentado el alcance
de las aplicaciones de la estadística a razón de que muchos de los conjuntos de datos se
pueden aproximar, con gran exactitud, utilizando modelos probabilísticos; por lo tanto, los
resultados de estas pueden utilizarse para analizar datos estadísticos. Así, la Probabilidad es
útil para comprobar la fiabilidad de las inferencias estadísticas y para predecir el tipo y la
cantidad de datos necesarios en un determinado estudio estadístico (Figueroa, 2014).
Entonces el análisis del Método de Regresión es una técnica estadística para investigar y
modelar la relación entre variables, de tal manera que son numerosas las aplicaciones de esto
en cualquier campo; incluyendo ciencias físicas, experimentales y sociales; y de hecho se
puede decir que esta técnica estadística es la más usada. Por lo tanto, este análisis sustenta la
fundamentación de los métodos numéricos que se basan en los modelos matemáticos para
desarrollarlo y efectuarlo mediante un ajuste polinomial (Hines, 1996).
3.3. Ajuste Matemático
3.3.1 Fundamentos sobre el Ajuste de Funciones polinomiales
El ajuste de funciones polinomiales es una técnica para el modelado de datos mediante una
ecuación (Bittinger, 2002), y es importante considerar la siguiente pregunta:
¿Cómo decidir qué tipo de función polinomial si existe, podría ajustarse a los datos?
Una forma simple consiste en examinar un Diagrama de Dispersión que es una gráfica
de datos de dos variables en la variable independiente está en el eje horizontal y la variable
dependiente en el eje vertical, entonces con esto se hace el énfasis en definir qué Tipos de
Variables se van a considerar en este modelo:
● Variable Dependiente: Es la variable que se predice o se explica. Se representa por
𝑦.
● Variable Independiente: Es la variable que sirve para predecir o explicar. Se
representa por 𝑥.
5
Luego, es importante buscar un patrón que se parezca a una de las gráficas de los tipos de
funciones polinomiales que hay. A continuación, se presenta un Procedimiento que se
considera y que la mayoría de las veces funciona para determinar modelos matemáticos:
1. Representar gráficamente los datos (en la forma de Diagrama de Dispersión).
2. Observar el diagrama de dispersión para determinar si parece ajustarse a una función
conocida.
3. Determinar una función que ajuste los datos.
Ahora con esto se va a utilizar el grupo de funciones polinomiales para observar cuál
función, si existe, podría ajustarse a ciertos datos:
● Los datos podrían modelarse mediante una función polinomial lineal si la gráfica
parece una línea recta.
● Los datos podrían modelarse mediante una función polinomial cuadrática, si la
gráfica sube y luego baja, o baja y luego sube, en una forma encorvada que se parezca
a una parábola.
● Si los datos caen, luego aumentan, y vuelven a caer (de modo que no se ajustan a una
función polinomial lineal o una función polinomial cuadrática), pero podrían
ajustarse a una función polinomial cúbica.
3.3.2. Definición del Método de Regresión por Mínimos Cuadrados
Es una técnica de análisis numérico enmarcada dentro de la optimización matemática, en
la que, dados un conjunto de pares ordenados que incluyen una variable independiente y una
variable dependiente. La cual busca encontrar la función continua, que mejor se aproxime a
los datos (un "mejor ajuste"), de acuerdo con el criterio de mínimo error cuadrático. Más aun,
esto coincide con el principio de máxima probabilidad de la estadística (Valdés, 2014).
Entonces decimos que, desde un punto de vista estadístico, un requisito implícito para que
funcione el método de mínimos cuadrados es que los errores de cada medida estén
distribuidos de forma aleatoria para determinar el mejor ajuste de una función polinomial a
través de la consideración de utilizar como mínimo cuatro puntos (Gerald, 2000).
3.3.3. Procedimiento del Método de Regresión por Mínimos Cuadrados
Se supone que se conocen datos que consta de 𝑛 puntos que se definen como:
( 𝑥1, 𝑦1), ( 𝑥2, 𝑦2), …, ( 𝑥 𝑛, 𝑦 𝑛) y que el objetivo es hallar una función polinomial 𝑦 = 𝑓(𝑥) que
se ajuste razonablemente a los datos, por lo que el primer paso es decidir qué tipo de función
probar a través de la inspección gráfica de los 𝑛 puntos, como se muestra en la 𝐅𝐢𝐠𝐮𝐫𝐚 𝟏.
6
𝐅𝐢𝐠𝐮𝐫𝐚 𝟏. Representación gráfica de los diferentes tipos de ajuste para encontrar una función polinomial
(Chapra, 2011).
Es importante evitar incertidumbres en la elección de la función de ajuste. Por lo tanto, se
considera una óptima decisión, a través del mínimo valor en su coeficiente de determinación
𝑅2
define su procedimiento a efectuar en este análisis, el cual representa el comportamiento
general de los datos como se muestra en la ecuación … (𝟐) (Carrillo, 2008).
𝑹 𝟐
= ∑ 𝒌=𝟏
𝒏
[ 𝒚 𝒌 − 𝒇( 𝒙 𝒏)]
𝟐
… (𝟐)
3.3.4. Clasificación de Modelos en las Funciones Polinomiales para el Método de
Regresión por Mínimos Cuadrados.
El caso más usado en la práctica es poder ajustar funciones polinomiales, ya que en este
caso los parámetros serán funciones de cualquier tipo que son fáciles de estimar (Marín,
2014).
El modelo a ajustar estará basado en su generalización del ajuste polinomial de grado 𝑚 que
está dado por:
𝒇(𝒙; 𝒂 𝟏, 𝒂 𝟐, … , 𝒂 𝒎) = 𝒂 𝟎 + 𝒂 𝟏 𝒙 + 𝒂 𝟐 𝒙 𝟐
+ ⋯ + 𝒂 𝒎 𝒙 𝒎
… (𝟑)
Por medio de esta consideración en la ecuación … (𝟑) se aproxima ahora a un conjunto de
datos {( 𝑥𝑖, 𝑦𝑖)}𝑖=1
𝑚
con una función polinomial algebraica de grado 𝑛 < 𝑚 − 1 mediante el
procedimiento de mínimos cuadrados (Mathews, 2000); por lo que se ha definido el
polinomio como:
𝒇 𝒏(𝒙𝒊) = 𝒂 𝟎 + 𝒂 𝟏 𝒙𝒊 + ⋯ + 𝒂 𝒏−𝟏 𝒙𝒊
𝒏−𝟏
+ 𝒂 𝒏 𝒙𝒊
𝒏
= ∑𝒋=𝟎
𝒏
𝒂𝒋 𝒙𝒊
𝒋
… (𝟒)
Para obtener el error más bajo en mínimos cuadrados, es necesario seleccionar de la
ecuación … (𝟒) las constantes 𝑎0, 𝑎1, … , 𝑎 𝑛 de tal manera que las derivadas parciales con
respecto a cada una de ellas sean cero y así para cada 𝑗:
𝑹 𝟐
= ∑𝒊=𝟏
𝒎
[𝒚𝒊 − 𝒇(𝒙𝒊)] 𝟐
= ∑𝒊=𝟏
𝒎
𝒚𝒊
𝟐
− 𝟐∑𝒋=𝟎
𝒏
𝒂𝒋(∑𝒊=𝟏
𝒎
𝒚𝒊 𝒙𝒊
𝒋
) + ∑𝒋=𝟎
𝒏
∑ 𝒌=𝟎
𝒏
𝒂𝒋 𝒂 𝒌(∑𝒊=𝟏
𝒎
𝒙𝒊
𝒋+𝒌
) … (𝟓)
𝝏𝑹 𝟐
𝝏𝒂𝒋
= −𝟐∑𝒊=𝟏
𝒎
𝒚𝒊 𝒙𝒊
𝒋
+ 𝟐∑ 𝒌=𝟎
𝒎
𝒂 𝒌∑𝒊=𝟏
𝒎
𝒙𝒊
𝒋+𝒌
… (𝟔)
7
Esto da 𝑛 + 1 ecuaciones normales con 𝑛 + 1 incógnitas 𝑎𝑗, por lo tanto,
∑ 𝒌=𝟎
𝒏
𝒂 𝒌∑𝒊=𝟏
𝒎
𝒙𝒊
𝒋+𝒌
= ∑𝒊=𝟏
𝒎
𝒚𝒊 𝒙𝒊
𝒋
… (𝟕)
Para cada 𝑗 = 0,1, … , 𝑛 se tiene:
𝒂 𝟎(∑𝒊=𝟏
𝒎
𝒙𝒊
𝟎
) + 𝒂 𝟏(∑𝒊=𝟏
𝒎
𝒙𝒊
𝟏
) + 𝒂 𝟐(∑𝒊=𝟏
𝒎
𝒙𝒊
𝟐
) + ⋯ + 𝒂 𝒏(∑𝒊=𝟏
𝒎
𝒙𝒊
𝒏
) = ∑𝒊=𝟏
𝒎
𝒚𝒊 𝒙𝒊
𝟎
𝒂 𝟎(∑𝒊=𝟏
𝒎
𝒙𝒊) + 𝒂 𝟏(∑𝒊=𝟏
𝒎
𝒙𝒊
𝟐
) + 𝒂 𝟐(∑𝒊=𝟏
𝒎
𝒙𝒊
𝟑
) + ⋯ + 𝒂 𝒏(∑𝒊=𝟏
𝒎
𝒙𝒊
𝒏+𝟏
) = ∑𝒊=𝟏
𝒎
𝒚𝒊 𝒙𝒊
𝟏
⋮
𝒂 𝟎(∑𝒊=𝟏
𝒎
𝒙𝒊
𝒏
) + 𝒂 𝟏(∑𝒊=𝟏
𝒎
𝒙𝒊
𝒏+𝟏
) + 𝒂 𝟐(∑𝒊=𝟏
𝒎
𝒙𝒊
𝒏+𝟐
) + ⋯ + 𝒂 𝒏(∑𝒊=𝟏
𝒎
𝒙𝒊
𝟐𝒏
) = ∑𝒊=𝟏
𝒎
𝒚𝒊 𝒙𝒊
𝒏
… (𝟖)
Por lo tanto, estas ecuaciones normales … (𝟖) tienen solución única siempre y cuando las
𝑥𝑖 sean distintas y en tal caso, la función apropiada de mínimos cuadrados (probablemente
un polinomio de grado 𝑛) puede deducirse con los valores de la función que se reemplace
con los datos cuando la medida de bondad de ajuste de 𝑅2
sea suficientemente pequeña, a
esto se le denomina “suavizamiento de datos” y su aplicación de esto es encontrar los
parámetros: 𝑎1, 𝑎2, … , 𝑎 𝑛 a través de la resolución de sistemas de ecuaciones normales
(Spiegel, 1970).
Entonces se supone ajustar una pareja de datos a través de este modelo de la función
polinomial generalizada en cuestión de la suma de los errores al cuadrado 𝑅2
que está dada
por:
𝑹 𝟐
= ∑ 𝒌=𝟏
𝑵
[𝒚 𝒌 − (𝒂 𝟎 + 𝒂 𝟏 𝒙 + 𝒂 𝟐 𝒙 𝟐
+ ⋯ + 𝒂 𝒎 𝒙 𝒎)] 𝟐
… (𝟗)
Para encontrar el valor de los parámetros 𝑎0, 𝑎1, … , 𝑎 𝑚 de … (𝟗) se procede a relacionar el
cambio de variables de los subíndices 𝑛 con 𝑚 que se definen en las sumatorias de … (𝟖);
por lo tanto, se obtiene el sistema de ecuaciones normales para el grado 𝑚 que está dada por:
𝒂 𝟎 𝑵 + 𝒂 𝟏(∑𝒊=𝟏
𝑵
𝒙𝒊) + ⋯ + 𝒂 𝒎(∑𝒊=𝟏
𝑵
𝒙𝒊
𝒎
) = ∑𝒊=𝟏
𝑵
𝒚𝒊
𝒂 𝟎(∑𝒊=𝟏
𝑵
𝒙𝒊) + 𝒂 𝟏(∑𝒊=𝟏
𝑵
𝒙𝒊
𝟐
) + ⋯ + 𝒂 𝒎(∑𝒊=𝟏
𝑵
𝒙𝒊
𝒎+𝟏
) = ∑𝒊=𝟏
𝑵
𝒙𝒊 𝒚𝒊
⋮
𝒂 𝟎(∑𝒊=𝟏
𝑵
𝒙𝒊
𝒎
) + 𝒂 𝟏(∑𝒊=𝟏
𝑵
𝒙𝒊
𝒎+𝟏
) + ⋯ + 𝒂 𝒎(∑𝒊=𝟏
𝑵
𝒙𝒊
𝟐𝒎
) = ∑𝒊=𝟏
𝑵
𝒙𝒊
𝒎
𝒚𝒊
… (𝟏𝟎)
Sin embargo, para hallar la función de mejor ajuste, se determinan los valores o coeficientes
respectivamente en cada caso de los tipos de funciones para 𝑎0, 𝑎1, … , 𝑎 𝑚 donde 𝑚 ≥ 0.
Por lo tanto, se considera el sistema de ecuaciones normales del ajuste polinomial de
grado 𝒎 … (𝟗) en términos matriciales de la forma 𝑿𝒂̂ = 𝒀, es decir:
[
𝑵
∑𝒊=𝟏
𝑵
𝒙𝒊
⋮
∑𝒊=𝟏
𝑵
𝒙𝒊
𝒎
∑𝒊=𝟏
𝑵
𝒙𝒊
∑𝒊=𝟏
𝑵
𝒙𝒊
𝟐
⋮
∑𝒊=𝟏
𝑵
𝒙𝒊
𝒎+𝟏
⋯
⋯
⋱
⋯
∑𝒊=𝟏
𝑵
𝒙𝒊
𝒎
∑𝒊=𝟏
𝑵
𝒙𝒊
𝒎+𝟏
⋮
∑𝒊=𝟏
𝑵
𝒙𝒊
𝟐𝒎
]
[
𝒂 𝟎
𝒂 𝟏
⋮
𝒂 𝒎
] =
[
∑𝒊=𝟏
𝑵
𝒚𝒊
∑𝒊=𝟏
𝑵
𝒙𝒊 𝒚𝒊
⋮
∑𝒊=𝟏
𝑵
𝒙𝒊
𝒎
𝒚𝒊]
… (𝟏𝟏)
8
Para encontrar la solución matricial se tiene que multiplicar la ecuación matricial 𝑿𝒂̂ = 𝒀 y
después se calcula su inversa (se multiplicó por la matriz transpuesta para que quede una
matriz cuadrada)
𝑿 𝑻
𝑿𝒂̂ = 𝑿 𝑻
𝒀 →∴ 𝒂̂ = ( 𝑿 𝑻
𝑿)
−𝟏
𝑿 𝑻
𝒀 … (𝟏𝟐)
Este sistema de ecuaciones lineales simultáneas se puede resolver fácilmente usando la
famosa regla de Cramer (para polinomios lineales y cuadráticos) y el método de eliminación
Gaussiana (para polinomios al menos de tercer grado).
Los coeficientes de la matriz de … (𝟏𝟏) se encuentran acomodando los datos en la Tabla
1.
𝐓𝐚𝐛𝐥𝐚 𝟏. 𝐀𝐣𝐮𝐬𝐭𝐞 𝐩𝐨𝐥𝐢𝐧𝐨𝐦𝐢𝐚𝐥 𝐝𝐞 𝐠𝐫𝐚𝐝𝐨 𝒎.
𝒊 𝒙𝒊 𝒙𝒊
𝟐
𝒙𝒊
𝟑 ⋯ 𝒙𝒊
𝟐𝒎 𝒚𝒊 𝒙𝒊 𝒚𝒊 𝒙𝒊
𝟐
𝒚𝒊 ⋯ 𝒙𝒊
𝒎
𝒚𝒊
1 𝑥1 𝑥1
2
𝑥1
3 ⋯ 𝑥1
2𝑚 𝑦1 𝑥1 𝑦1 𝑥1
2
𝑦1 ⋯ 𝑥1
𝑚
𝑦1
2 𝑥2 𝑥2
2
𝑥2
3 ⋯ 𝑥2
2𝑚 𝑦2 𝑥2 𝑦2 𝑥2
2
𝑦2 ⋯ 𝑥2
𝑚
𝑦2
3 𝑥3 𝑥3
2
𝑥3
3 ⋯ 𝑥3
2𝑚 𝑦3 𝑥3 𝑦3 𝑥3
2
𝑦3 ⋯ 𝑥3
𝑚
𝑦3
⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮
𝑁 𝑥 𝑁 𝑥 𝑁
2
𝑥 𝑁
3 ⋯ 𝑥 𝑁
2𝑚 𝑦 𝑁 𝑥 𝑁 𝑦 𝑁 𝑥 𝑁
2
𝑦 𝑁 ⋯ 𝑥 𝑁
𝑚
𝑦 𝑁
∑𝑖=1
𝑁
𝑥𝑖 ∑𝑖=1
𝑁
𝑥𝑖
2
∑𝑖=1
𝑁
𝑥𝑖
3
⋯ ∑𝑖=1
𝑁
𝑥𝑖
2𝑚
∑𝑖=1
𝑁
𝑦𝑖 ∑𝑖=1
𝑁
𝑥𝑖 𝑦𝑖 ∑𝑖=1
𝑁
𝑥𝑖
2
𝑦𝑖 ⋯ ∑𝑖=1
𝑁
𝑥𝑖
𝑚
𝑦𝑖
3.3.4.1. Ajuste de la función polinomial lineal 𝒚 = 𝒂 𝟎 + 𝒂 𝟏 𝒙
Se recuerda que una aproximación por mínimos cuadrados consiste en ajustar a una línea
recta un conjunto de datos discretos de la forma: ( 𝑥1, 𝑦1), ( 𝑥2, 𝑦2), …, ( 𝑥 𝑁, 𝑦 𝑁)
Por lo tanto, se inicia en considerar una ecuación de una línea recta a la cual se relaciona
al comportamiento de los datos y el modelo propuesto, de esta forma se tiene: 𝑦 = 𝑎0 +
𝑎1 𝑥 dónde 𝑎0 =es la ordenada al origen y 𝑎1 =es la pendiente.
Al aplicar el criterio de que el “mejor” ajuste se cumple cuando se puede minimizar la
suma de los cuadrados de los residuos 𝑹 𝟐
, es decir, el error entre el modelo y los datos
experimentales, se tiene que:
𝑹 𝟐
= ∑𝒊=𝟏
𝒏
( 𝒚 𝟏 − 𝒂 𝟎 − 𝒂 𝟏 𝒙𝒊) 𝟐
… (𝟏𝟑)
Este criterio tiene la ventaja de proporcionar una línea única para un conjunto de datos.
Para determinar los valores de 𝑎0 y 𝑎1 que minimizan la ecuación se deriva la ecuación con
respecto a cada uno de los coeficientes
9
𝝏𝑹 𝟐
𝝏𝒂 𝟎
= −𝟐∑(𝒚𝒊 − 𝒂 𝟎 − 𝒂 𝟏 𝒙𝒊) = 𝟎
𝝏𝑹 𝟐
𝝏𝒂 𝟏
= −𝟐∑[(𝒚 𝟏 − 𝒂 𝟎 − 𝒂 𝟏 𝒙𝒊)𝒙𝒊] = 𝟎
… (𝟏𝟒)
Al igualar ambas derivadas en las ecuaciones … (𝟏𝟒) a cero, se genera un mínimo para la
suma de los cuadrados de los residuos 𝑹 𝟐
de la siguiente forma:
−𝟐∑(𝒚𝒊 − 𝒂 𝟎 − 𝒂 𝟏 𝒙𝒊) = 𝟎 = ∑𝒚𝒊 − ∑𝒂 𝟎 − ∑𝒂 𝟏 𝒙𝒊 … (𝟏𝟓)
−𝟐∑[(𝒚 𝟏 − 𝒂 𝟎 − 𝒂 𝟏 𝒙𝒊)𝒙𝒊] = 𝟎 = ∑𝒚𝒊 𝒙𝒊 − ∑𝒂 𝟎 𝒙𝒊 − ∑𝒂 𝟏 𝒙𝒊
𝟐
… (𝟏𝟔)
De la ecuación … (𝟏𝟒) se obtiene
∑𝒚𝒊 = 𝒏𝒂 𝟎 + 𝒂 𝟏∑𝒙𝒊 … (𝟏𝟕)
De la ecuación … (𝟏𝟓) se obtiene
∑𝒚𝒊 𝒙𝒊 = 𝒂 𝟎∑𝒙𝒊 + 𝒂 𝟏∑(𝒙𝒊) 𝟐
… . (𝟏𝟖)
Al resolver en forma simultánea las ecuaciones … (𝟏𝟕) y … (𝟏𝟖) se obtienen los valores
de 𝑎0 y 𝑎1 mediante las siguientes ecuaciones:
𝒂 𝟏 =
𝒏 ∑ 𝒙𝒊 𝒚𝒊 − ∑ 𝒙𝒊 𝒚 𝟏
𝒏 ∑ 𝒙𝒊
𝟐
− (∑ 𝒙𝒊) 𝟐
… (𝟏𝟗), 𝒂 𝒐 =
∑ 𝒚𝒊
𝒏
− 𝒂 𝟏 (
∑ 𝒙𝒊
𝒏
) … (𝟐𝟎)
Por lo tanto, construyendo la Tabla 2; para el caso lineal.
𝐓𝐚𝐛𝐥𝐚 𝟐. 𝐀𝐣𝐮𝐬𝐭𝐞 𝐩𝐨𝐥𝐢𝐧𝐨𝐦𝐢𝐚𝐥 𝐥𝐢𝐧𝐞𝐚𝐥
𝒊 𝒙𝒊 𝒙𝒊
𝟐 𝒚𝒊 𝒙𝒊 𝒚𝒊
1 𝑥1 𝑥1
2 𝑦1 𝑥1 𝑦1
2 𝑥2 𝑥2
2 𝑥2 𝑥2 𝑦2
3 𝑥3 𝑥3
2 𝑦3 𝑥3 𝑦3
⋮ ⋮ ⋮ ⋮ ⋮
𝑁 𝑥 𝑁 𝑥 𝑁
2 𝑦 𝑁 𝑥 𝑁 𝑦 𝑁
Suma por
columna ∑𝒊=𝟏
𝑵
𝒙𝒊 ∑𝒊=𝟏
𝑵
𝒙𝒊
𝟐
∑𝒊=𝟏
𝑵
𝒚𝒊 ∑𝒊=𝟏
𝑵
𝒙𝒊 𝒚𝒊
Las ecuaciones normales matriciales para el caso del ajuste lineal están dadas por:
[
𝑵 ∑𝒊=𝟏
𝑵
𝒙𝒊
∑𝒊=𝟏
𝑵
𝒙𝒊 ∑𝒊=𝟏
𝑵
𝒙𝒊
𝟐] [
𝒂 𝟎
𝒂 𝟏
] = [
∑𝒊=𝟏
𝑵
𝒚𝒊
∑𝒊=𝟏
𝑵
𝒙𝒊 𝒚𝒊
] … (𝟐𝟏)
Este sistema de ecuaciones … (𝟐𝟏) se puede resolver con los métodos habituales (suma y
resta, Cramer, sustitución, etc.).
10
3.3.4.2. Ajuste de la función polinomial cuadrático 𝒚 = 𝒂 𝟎 + 𝒂 𝟏 𝒙 + 𝒂 𝟐 𝒙 𝟐
De la misma
manera considerando la Tabla 3; para una ajuste cuadrático o parabólico.
𝐓𝐚𝐛𝐥𝐚 𝟑. 𝐀𝐣𝐮𝐬𝐭𝐞 𝐩𝐨𝐥𝐢𝐧𝐨𝐦𝐢𝐚𝐥 𝐜𝐮𝐚𝐝𝐫á𝐭𝐢𝐜𝐨.
𝒊 𝒙𝒊 𝒙𝒊
𝟐
𝒙𝒊
𝟑
𝒙𝒊
𝟒 𝒚𝒊 𝒙𝒊 𝒚𝒊 𝒙𝒊
𝟐
𝒚𝒊
1 𝑥1 𝑥1
2
𝑥1
3
𝑥1
4 𝑦1 𝑥1 𝑦1 𝑥1
2
𝑦1
2 𝑥2 𝑥2
2
𝑥2
3
𝑥2
4 𝑥2 𝑥2 𝑦2 𝑥2
2
𝑦2
3 𝑥3 𝑥3
2
𝑥3
3
𝑥3
4 𝑦3 𝑥3 𝑦3 𝑥3
2
𝑦3
⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮
𝑁 𝑥 𝑁 𝑥 𝑁
2
𝑥 𝑁
3
𝑥 𝑁
4 𝑦 𝑁 𝑥 𝑁 𝑦 𝑁 𝑥 𝑁
2
𝑦 𝑁
Suma por
columna ∑𝒊=𝟏
𝑵
𝒙𝒊 ∑𝒊=𝟏
𝑵
𝒙𝒊
𝟐
∑𝒊=𝟏
𝑵
𝒙𝒊
𝟑
∑𝒊=𝟏
𝑵
𝒙𝒊
𝟒
∑𝒊=𝟏
𝑵
𝒚𝒊 ∑𝒊=𝟏
𝑵
𝒙𝒊 𝒚𝒊 ∑𝒊=𝟏
𝑵
𝒙𝒊
𝟐
𝒚𝒊
Las ecuaciones normales para el caso del ajuste polinomial cuadrático están dadas por:
[
𝑵 ∑𝒊=𝟏
𝑵
𝒙𝒊 ∑𝒊=𝟏
𝑵
𝒙𝒊
𝟐
∑𝒊=𝟏
𝑵
𝒙𝒊 ∑𝒊=𝟏
𝑵
𝒙𝒊
𝟐
∑𝒊=𝟏
𝑵
𝒙𝒊
𝟑
∑𝒊=𝟏
𝑵
𝒙𝒊
𝟐
∑𝒊=𝟏
𝑵
𝒙𝒊
𝟑
∑𝒊=𝟏
𝑵
𝒙𝒊
𝟒
] [
𝒂 𝟎
𝒂 𝟏
𝒂 𝟐
] = [
∑𝒊=𝟏
𝑵
𝒚𝒊
∑𝒊=𝟏
𝑵
𝒙𝒊 𝒚𝒊
∑𝒊=𝟏
𝑵
𝒙𝒊
𝟐
𝒚𝒊
] … (𝟐𝟐)
Este sistema de ecuaciones … (𝟐𝟐) se puede resolver con los métodos de Cramer de 3
variables con 3 incógnitas.
3.3.4.3. Ajuste de la función polinomial cúbico: 𝒚 = 𝒂 𝟎 + 𝒂 𝟏 𝒙 +𝒂 𝟐 𝒙 𝟐
+ 𝒂 𝟑 𝒙 𝟑
Similarmente, considerando la Tabla 4; para el caso cúbico.
𝐓𝐚𝐛𝐥𝐚 𝟒. 𝐀𝐣𝐮𝐬𝐭𝐞 𝐩𝐨𝐥𝐢𝐧𝐨𝐦𝐢𝐚𝐥 𝐜ú𝐛𝐢𝐜𝐨
𝒊 𝒙𝒊 𝒙𝒊
𝟐
𝒙𝒊
𝟑
𝒙𝒊
𝟒
𝒙𝒊
𝟓
𝒙𝒊
𝟔 𝒚𝒊 𝒙𝒊 𝒚𝒊 𝒙𝒊
𝟐
𝒚𝒊 𝒙𝒊
𝟑
𝒚𝒊
1 𝑥1 𝑥1
2
𝑥1
3
𝑥1
4
𝑥1
5 𝑥1
6 𝑦1 𝑥1 𝑦1 𝑥1
2
𝑦1 𝑥1
3
𝑦1
2 𝑥2 𝑥2
2
𝑥2
3
𝑥2
4
𝑥2
5 𝑥2
6 𝑥2 𝑥2 𝑦2 𝑥2
2
𝑦2 𝑥2
3
𝑦2
3 𝑥3 𝑥3
2
𝑥3
3
𝑥3
4
𝑥3
5
𝑥3
6 𝑦3 𝑥3 𝑦3 𝑥3
2
𝑦3 𝑥3
3
𝑦3
⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮
𝑁 𝑥 𝑁 𝑥 𝑁
2
𝑥 𝑁
3
𝑥 𝑁
4
𝑥 𝑁
5 𝑥 𝑁
6 𝑦 𝑁 𝑥 𝑁 𝑦 𝑁 𝑥 𝑁
2
𝑦 𝑁 𝑥 𝑁
3
𝑦 𝑁
Suma por
columna ∑𝒊=𝟏
𝑵
𝒙𝒊 ∑𝒊=𝟏
𝑵
𝒙𝒊
𝟐
∑𝒊=𝟏
𝑵
𝒙𝒊
𝟑
∑𝒊=𝟏
𝑵
𝒙𝒊
𝟒
∑𝒊=𝟏
𝑵
𝒙𝒊
𝟓
∑𝒊=𝟏
𝑵
𝒙𝒊
𝟔
∑𝒊=𝟏
𝑵
𝒚𝒊 ∑𝒊=𝟏
𝑵
𝒙𝒊 𝒚𝒊 ∑𝒊=𝟏
𝑵
𝒙𝒊
𝟐
𝒚𝒊 ∑𝒊=𝟏
𝑵
𝒙𝒊
𝟑
𝒚𝒊
Las ecuaciones normales matriciales para el caso del ajuste cúbico están dadas por el
siguiente sistema de 4 variables y 4 ecuaciones:
11
[
𝑵
∑𝒊=𝟏
𝑵
𝒙𝒊
∑𝒊=𝟏
𝑵
𝒙𝒊
𝟐
∑𝒊=𝟏
𝑵
𝒙𝒊
𝟑
∑𝒊=𝟏
𝑵
𝒙𝒊
∑𝒊=𝟏
𝑵
𝒙𝒊
𝟐
∑𝒊=𝟏
𝑵
𝒙𝒊
𝟑
∑𝒊=𝟏
𝑵
𝒙𝒊
𝟒
∑𝒊=𝟏
𝑵
𝒙𝒊
𝟐
∑𝒊=𝟏
𝑵
𝒙𝒊
𝟑
∑𝒊=𝟏
𝑵
𝒙𝒊
𝟒
∑𝒊=𝟏
𝑵
𝒙𝒊
𝟓
∑𝒊=𝟏
𝑵
𝒙𝒊
𝟑
∑𝒊=𝟏
𝑵
𝒙𝒊
𝟒
∑𝒊=𝟏
𝑵
𝒙𝒊
𝟓
∑𝒊=𝟏
𝑵
𝒙𝒊
𝟔
]
[
𝒂 𝟎
𝒂 𝟏
𝒂 𝟐
𝒂 𝟑
] =
[
∑𝒊=𝟏
𝑵
𝒚𝒊
∑𝒊=𝟏
𝑵
𝒙𝒊 𝒚𝒊
∑𝒊=𝟏
𝑵
𝒙𝒊
𝟐
𝒚𝒊
∑𝒊=𝟏
𝑵
𝒙𝒊
𝟑
𝒚𝒊]
… (𝟐𝟑)
Se sugiere utilizar los casos de la Tabla 2 hasta la Tabla 4 de la generalización de la Tabla
1, a razón de que estos dan un óptimo ajuste para poder encontrar el valor de los parámetros
𝑎 𝑘 con 𝑘 = 1, … , 𝑚 que minimicen esta suma; es decir:
𝐦𝐢𝐧
𝒂 𝟏,…,𝒂 𝒎
𝑹 𝟐
= 𝐦𝐢𝐧
𝒂 𝟏,…,𝒂 𝒎
∑[𝒚 𝒌 − 𝒇(𝒙 𝒌; 𝒂 𝟏, 𝒂 𝟐, … , 𝒂 𝒎)] 𝟐
… (𝟐𝟒)
Para poder encontrar estos coeficientes de la ecuación … (𝟐𝟒) se debe cumplir cada una de
las ecuaciones presentadas en los casos de la Tabla 2 hasta la Tabla 4; a través del criterio
siguiente:
𝝏(𝑹 𝟐)
𝝏𝒂𝒊
= 𝟎 𝐜𝐨𝐧 𝒊 = 𝟏, … , 𝒎. … (𝟐𝟓)
En términos generales es un sistema de ecuaciones no lineales con 𝑚 restricciones (Marín,
2014).
3.3.5. Los residuales que definen al Método de Regresión por Mínimos Cuadrados
En el caso práctico no es posible encontrar esta función polinomial 𝑦 = 𝑓(𝑥) y que
satisfaga exactamente todas las relaciones:
𝒚 𝟏 = 𝒇(𝒙 𝟏)
𝒚 𝟐 = 𝒇(𝒙 𝟐)
⋮
𝒚 𝒏 = 𝒇(𝒙 𝒏)
… (𝟐𝟔)
Por lo general, uno está dispuesto a aceptar un "residual" (que dependerá de cada
observación) y se define de la manera siguiente:
𝒇(𝒙 𝒌) = 𝒚 𝒌 + 𝒆 𝒌 … (𝟐𝟕)
Donde 𝑒 𝑘 es el residual que define la medición observada en el dato. La pregunta que uno
se hace es ¿cómo poder encontrar "la mejor aproximación" que pase por los puntos? (Smith,
1988). Para responder esta pregunta, hay que considerar los residuales (también llamado
como las desviaciones) y están dados como la diferencia del valor estimado por el modelo
𝑓( 𝑥 𝑘) menos el valor observado 𝑦 𝑘, es decir:
Residuales de Medición
𝒆 𝒌 = 𝒇(𝒙 𝒌) − 𝒚 𝒌 𝐩𝐚𝐫𝐚 𝟏 ≤ 𝒌 ≤ 𝒏 … (𝟐𝟖)
𝐑𝐞𝐬𝐢𝐝𝐮𝐚𝐥 = 𝐕𝐚𝐥𝐨𝐫 𝐄𝐬𝐭𝐢𝐦𝐚𝐝𝐨 − 𝐕𝐚𝐥𝐨𝐫 𝐎𝐛𝐬𝐞𝐫𝐯𝐚𝐝𝐨 … (𝟐𝟗)
12
Esta diferencia también suele denotarse por 𝑒𝑖y con esto se podrá determinar el “residual de
estimación” que permite fijar límites dentro de los cuales estará el valor real con cierto grado
de confiabilidad entre los datos verdaderos u observados de 𝑦𝑖 y los datos estimados o
evaluados de 𝑦𝑖̂ , es decir:
𝒆𝒊 = 𝒚𝒊 − 𝒚𝒊̂ →∴ 𝒆𝒊 = 𝒚𝒊 − 𝒇̂(𝒙𝒊) … (𝟑𝟎)
Esta ecuación debe satisfacer la condición de minimizar la suma de las residuales (𝑒𝑖) del
comportamiento de cada par de datos discretos (Quintana, 2005), con respecto al modelo
propuesto, elevadas al cuadrado, es decir:
∑ 𝒆𝒊
𝟐
= ∑[𝒚𝒊 − 𝒇̂(𝒙𝒊)]
𝟐
𝒏
𝒊=𝟏
= ∑(𝒚𝒊 − 𝒚𝒊̂ ) 𝟐
→∴ ∑(𝒚𝒊,𝒎𝒆𝒅𝒊𝒅𝒂 − 𝒚̂𝒊,𝒎𝒐𝒅𝒆𝒍𝒐)
𝟐
… (𝟑𝟏)
En la Figura 2 se representa la ecuación … (𝟐𝟗)
𝐅𝐢𝐠𝐮𝐫𝐚 𝟐. Comparación gráfica de los valores observados y de los valores estimados en el residual de medición
(Marín, 2013)
Este análisis describe las predicciones generacionales a través del cálculo del residual;
que este sea lo más exacto posible, es decir un valor mínimo para encontrar el mejor ajuste
para los datos presentados e inferir qué acciones se debe llevar a cabo para cada situación
respectiva en la modalidad del estudio a efectuar (Anderson, 2008).
La validez de la aplicación del método de mínimos cuadrados para el ajuste de funciones
descansa sobre tres suposiciones sobre los residuales que son la:
1.-Independencia: requiere que los residuales sean independientes unos de otros.
2.-Normalidad: requiere que los residuales se distribuyen normalmente en cada valor de la
variable independiente.
3.-Homocedasticidad: requiere que la varianza de los residuales sea constante; es decir
requiere que tengan igual varianza.
Esta validez de la aplicación del método de mínimos cuadrados se define como el criterio
de determinación del mejor ajuste polinomial, dado por:
13
𝐦𝐢𝐧 𝐑 𝟐
> 𝐑 𝐚
𝟐
(Infante, 2012) … (𝟑𝟐)
𝐃𝐨𝐧𝐝𝐞:
R2
= Coeficiente de determinación
Ra
2
= Coeficiente de determinación ajustado
La ecuación … (𝟑𝟐) nos precisa que modelo de función polinomial es el óptimo, para que
este sea el detonador de poder pronosticar los rangos con certeza.
3.3.6. Intervalos de predicción
Considerando el ajuste de la función polinomial, se asume que tienen 𝑁 parejas de
números (𝑥1, 𝑦1), (𝑥2, 𝑦2) hasta (𝑥 𝑁, 𝑦 𝑁) y se desea ajustar el mejor polinomio de grado 𝑚
dado por:
𝒚 = 𝒂 𝟎 + 𝒂 𝟏 𝒙 + 𝒂 𝟐 𝒙 𝟐
+ ⋯ + 𝒂 𝒎 𝒙 𝒎
… (𝟑𝟑)
Por lo tanto, se definen los probables intervalos de predicción al 95% de la deserción
estudiantil para esta dependencia del IEMSDF, con su respectiva generación en 𝑥 𝑝, dada por:
𝒚 𝒑 = 𝑿 𝒑 𝒂̂ ± 𝒕 𝟎.𝟗𝟕𝟓
𝑵−(𝒎+𝟏)
𝝈̂√𝟏 + 𝑿 𝒑(𝑿 𝑻 𝑿)−𝟏 𝑿 𝒑
𝑻
(Wackerly, 2010) … (𝟑𝟒)
𝐃𝐨𝐧𝐝𝐞:
La variable definida generacional del porcentaje de deserción a predecir = 𝒚 𝒑
La matriz pronóstico para 𝑝 datos generacionales = 𝑿 𝒑 = [ 𝟏 𝒙 𝒑 ⋯ 𝒙 𝒑
𝒎
]
La matriz de parámetros = 𝒂̂ = (𝑿 𝑻
𝑿)
−𝟏
𝑿 𝑻
𝒀 = [
𝒂 𝟎
𝒂 𝟏
⋮
𝒂 𝒎
]
El percentil de una 𝑡 Student = 𝒕 𝟎.𝟗𝟕𝟓
𝑵−(𝒎+𝟏)
con 𝑵 − (𝒎 + 𝟏) = 𝒗 grados de libertad.
𝐂𝐨𝐧𝐬𝐢𝐝𝐞𝐫𝐚𝐧𝐝𝐨 𝐪𝐮𝐞:
𝒎 = Grado del polinomio que se obtuvo en el ajuste.
𝑿 = [
𝟏
𝟏
⋮
𝟏
𝒙 𝟏
𝒙 𝟐
⋮
𝒙 𝑵
⋯
⋯
⋱
⋯
𝒙 𝟏
𝒎
𝒙 𝟐
𝒎
⋮
𝒙 𝑵
𝒎
] = La matriz de diseño del ajuste polinomial.
𝒀 = [
𝒚 𝟏
𝒚 𝟐
⋮
𝒚 𝑵
] = La matriz de respuesta del modelo ajustado a los datos.
𝑿 𝑻
= La matriz transpuesta de diseño del ajuste polinomial.
𝑵 = Número de datos.
14
(𝑿 𝑻
𝑿)
−𝟏
= La matriz inversa.
El error estándar de estimación = 𝝈̂ = √
𝑺𝑪𝑬
𝑵 − (𝒎 + 𝟏)
= √
𝒀 𝑻 𝒀 − 𝒂̂ 𝑻 𝑿 𝑻 𝒀
𝑵 − (𝒎 + 𝟏)
𝐃𝐞𝐟𝐢𝐧𝐢𝐞𝐧𝐝𝐨:
𝑺𝑪𝑬 = Suma de cuadrados del error.
𝒀 𝑻
= La matriz transpuesta de respuesta del modelo ajustado a los datos.
𝒂̂ 𝑻
= La matriz transpuesta de los parámetros.
Respecto al orden de la bivalencia ± el intervalo de predicción es expresado como:
𝑿 𝒑 𝒂̂ − 𝒕 𝟎.𝟗𝟕𝟓
𝑵−(𝒎+𝟏)
𝝈̂√𝟏 + 𝑿 𝒑(𝑿 𝑻 𝑿)−𝟏 𝑿 𝒑
𝑻 ≤ 𝒚 𝒑 ≤ 𝑿 𝒑 𝒂̂ + 𝒕 𝟎.𝟗𝟕𝟓
𝑵−(𝒎+𝟏)
𝝈̂√𝟏 + 𝑿 𝒑(𝑿 𝑻 𝑿)−𝟏 𝑿 𝒑
𝑻 … (𝟑𝟓)
La hipótesis indica que el valor esperado de los residuales sea cero y también que la
varianza de los errores sea constante, es decir:
𝑬[𝒆 𝒌] = 𝟎 𝐩𝐚𝐫𝐚 𝒌 = 𝟏, 𝟐, … , 𝒏
𝑽𝒂𝒓[𝒆 𝒌] = 𝝈̂ 𝐩𝐚𝐫𝐚 𝒌 = 𝟏, 𝟐, … , 𝒏
(Infante, 2012) … (𝟑𝟔)
4. Metodología
En este proyecto fue necesario recurrir al ordenador, para poder resolver el objetivo
planteado; por lo que se utilizaron las siguientes herramientas computacionales:
● La hoja de cálculo de Microsoft Excel 2016 del sistema operativo Windows 10.
● Wólfram Alpha desde: http://www.wolframalpha.com/
● Matrixcalc versión slu. desde: https://matrixcalc.org/es/slu.html
● Octave-MATLAB desde: http://octave-online.net/
Es de especial importancia considerarlo a razón de que se plantea el modelo óptimo para
dar respuesta a las siguientes cuestiones fundamentales:
1). ¿Cuáles son las relaciones en las que estará basado el modelo? El fenómeno de la
deserción estudiantil en la dependencia del IEMS-DF se considera por medio de las
generaciones escolares, en este caso se tomará la relación del ingreso-egreso de cada
generación de todos los planteles de la modalidad escolarizada.
2). ¿Cuál es la formulación del Modelo? A través de los datos registrados del Sistema de
Información Mexicana del Distrito Federal (INFOMEXDF), para poder inferir los valores
estimados a pronosticar a través del ajuste de funciones polinomiales, se considera la relación
numérica de orden cronológico de la generación en los valores discretos, es decir: Si la
15
primera generación del IEMS-DF fue en 2001-2002, se considera por conveniencia al
modelo, como generación 1.
3). ¿Qué atributos caracterizan el modelo? Por medio de la fórmula del porcentaje de
deserción generacional-PDG, ecuación … (𝟏), para aplicarlo en Excel:
𝐓𝐚𝐛𝐥𝐚 𝟓. 𝐃𝐚𝐭𝐨𝐬 𝐝𝐞 𝐥𝐚 𝐝𝐞𝐩𝐞𝐧𝐝𝐞𝐧𝐜𝐢𝐚 𝐈𝐄𝐌𝐒𝐃𝐅 (𝐒𝐢𝐬𝐭𝐞𝐦𝐚 𝐈𝐍𝐅𝐎𝐌𝐄𝐗𝐃𝐅, 𝟐𝟎𝟏𝟔)
𝐆𝐞𝐧𝐞𝐫𝐚𝐜𝐢ó𝐧 𝐄𝐈𝐆 𝐄𝐄𝐆 𝐏𝐃𝐆
2001 − 𝟏 3062 349 𝟖𝟖. 𝟔𝟎
2002 − 𝟐 3719 644 𝟖𝟐. 𝟔𝟖
2003 − 𝟑 3401 901 𝟕𝟑. 𝟓𝟏
2004 − 𝟒 5647 1390 𝟕𝟓. 𝟑𝟗
2005 − 𝟓 5443 1602 𝟕𝟎. 𝟓𝟕
2006 − 𝟔 5538 1765 𝟔𝟖. 𝟏𝟑
2007 − 𝟕 5762 1735 𝟔𝟗. 𝟖𝟗
2008 − 𝟖 5804 1533 𝟕𝟑. 𝟓𝟗
2009 − 𝟗 5729 1502 𝟕𝟑. 𝟕𝟖
2010 − 𝟏𝟎 6149 1591 𝟕𝟒. 𝟏𝟑
2011 − 𝟏𝟏 6625 1700 𝟕𝟒. 𝟑𝟒
2012 − 𝟏𝟐 6372 1601 𝟕𝟒. 𝟖𝟕
2013 − 𝟏𝟑 6349 ¿ ? ¿ ?
2014 − 𝟏𝟒 6826 ¿ ? ¿ ?
4.) ¿Cuáles son las restricciones a emplear para simplificar el modelo? Cabe aclarar que
en el presente trabajo se tomará en cuenta las siguientes variables:
● Variable cuantitativa independiente ( 𝑥): Define la generación del año escolar
donde se analiza la deserción de estudiantes en esta dependencia del IEMS-DF.
● Variable cuantitativa dependiente ( 𝑦): Define el porcentaje de la deserción
generacional estudiantil de esta dependencia del IEMS-DF.
Esto implica relacionar y definir las siguientes parejas ordenadas:
(𝐱 𝟏, 𝐲 𝟏 ) = (𝐠𝐞𝐧𝐞𝐫𝐚𝐜𝐢ó𝐧 𝟏, 𝐏𝐃𝐆 𝟏)
⋮
(𝐱 𝐧, 𝐲 𝐧) = (𝐠𝐞𝐧𝐞𝐫𝐚𝐜𝐢ó𝐧 𝐧, 𝐏𝐃𝐆 𝐧)
… (𝟑𝟕)
Dónde la ecuación … (𝟑𝟕) se delimita, como los valores discretos por conveniencia a la
respectiva generación 𝑛 = 1,2, … ,12; que estos se relacionan, como:
(𝐱 𝟏, 𝐲 𝟏 ) = (𝟏, 𝐏𝐃𝐆 𝟏)
⋮
(𝐱 𝟏𝟐, 𝐲 𝟏𝟐) = (𝟏𝟐, 𝐏𝐃𝐆 𝟏𝟐)
… (𝟑𝟖)
16
Luego, se toma la consideración de la ecuación … (𝟑𝟖), para poder realizar el siguiente
arreglo, que va a definir el ajuste:
𝐓𝐚𝐛𝐥𝐚 𝟔. 𝐑𝐞𝐥𝐚𝐜𝐢ó𝐧 𝐝𝐞 𝐯𝐚𝐫𝐢𝐚𝐛𝐥𝐞𝐬 𝐟𝐮𝐧𝐝𝐚𝐦𝐞𝐧𝐭𝐚𝐥𝐞𝐬 𝐩𝐚𝐫𝐚 𝐞𝐥 𝐚𝐣𝐮𝐬𝐭𝐞 𝐩𝐨𝐥𝐢𝐧𝐨𝐦𝐢𝐚𝐥 𝐜𝐮𝐚𝐝𝐫á𝐭𝐢𝐜𝐨.
𝒙𝒊 𝒚𝒊
𝟏 88.60
𝟐 82.68
𝟑 73.51
𝟒 75.39
𝟓 70.57
𝟔 68.13
𝟕 69.89
𝟖 73.59
𝟗 73.78
𝟏𝟎 74.13
𝟏𝟏 74.34
𝟏𝟐 74.87
𝐒𝐢𝐞𝐧𝐝𝐨:
𝒙𝒊 = 𝐑𝐞𝐩𝐫𝐞𝐬𝐞𝐧𝐭𝐚𝐜𝐢ó𝐧 𝐝𝐞 𝐥𝐚 𝐠𝐞𝐧𝐞𝐫𝐚𝐜𝐢ó𝐧 𝐞𝐬𝐜𝐨𝐥𝐚𝐫 𝐞𝐧 𝐥𝐨𝐬 𝐯𝐚𝐥𝐨𝐫𝐞𝐬 𝐝𝐢𝐬𝐜𝐫𝐞𝐭𝐨𝐬
𝒚𝒊 = 𝐏𝐨𝐫𝐜𝐞𝐧𝐭𝐚𝐣𝐞 𝐝𝐞 𝐝𝐞𝐬𝐞𝐫𝐜𝐢ó𝐧 𝐠𝐞𝐧𝐞𝐫𝐚𝐜𝐢𝐨𝐧𝐚𝐥 (𝐏𝐃𝐆) = (
𝐄𝐈𝐆 − 𝐄𝐄𝐆
𝐄𝐈𝐆
) ∗ 𝟏𝟎𝟎
5.) ¿Cuál es el criterio del mejor ajuste a los datos en el modelo? Para poder realizar el
óptimo ajuste polinomial a los datos de la Tabla 6, se corrobora mediante el software
wólfram alpha: http://www.wolframalpha.com/ de la siguiente manera:
fit {{1,86.60}, {2,82.68}, {3,73.51}, {4,75.39}, {5,70.57}, {6,68.13}, {7,69.89}, {8,73.59},
{9,73.78}, {10,74.13}, {11,74.34}, {12,74.87}}
Esta sintaxis a ejecutar, dará las mejores opciones de ajuste polinomiales a los datos que en
este caso, su diagnóstico, es:
𝐅𝐢𝐠𝐮𝐫𝐚 𝟑. El diagnóstico de los ajustes viables a los datos en 𝑤ó𝑙𝑓𝑟𝑎𝑚 𝑎𝑙𝑝ℎ𝑎.
17
Para encontrar el óptimo ajuste polinomial a los datos, del diagnóstico de la Figura 3, se
emplea el criterio de determinación del mejor ajuste de la ecuación … (𝟑𝟐), para poder
encontrar la función que definirá los intervalos de predicción de la ecuación … (𝟑𝟓); por lo
tanto, en este caso, resulta:
𝐦𝐢𝐧 𝐑 𝟐
> 𝐑 𝐚
𝟐
→ 0.793787 > 0.747962 →∴ 𝐅𝐮𝐧𝐜𝐢ó𝐧 𝐂𝐮𝐚𝐝𝐫á𝐭𝐢𝐜𝐚 … (𝟑𝟗)
Con la determinación de la ecuación … (𝟑𝟗) se va a proceder a realizar manualmente la
Tabla 3 del ajuste polinomial cuadrático correspondiente para poder aplicar la relación de
variables en el método de los mínimos cuadrados de la siguiente manera:
𝐓𝐚𝐛𝐥𝐚 𝟕. 𝐀𝐣𝐮𝐬𝐭𝐞 𝐩𝐨𝐥𝐢𝐧𝐨𝐦𝐢𝐚𝐥 𝐝𝐞 𝐥𝐚 𝐝𝐞𝐩𝐞𝐧𝐝𝐞𝐧𝐜𝐢𝐚 𝐈𝐄𝐌𝐒𝐃𝐅
𝒊 𝒙𝒊 𝒙𝒊
𝟐
𝒙𝒊
𝟑
𝒙𝒊
𝟒 𝒚𝒊 𝒙𝒊 𝒚𝒊 𝒙𝒊
𝟐
𝒚𝒊
1 1 1 1 1 88.60 88.60 88.60
2 2 4 8 16 82.68 165.36 330.72
3 3 9 27 81 73.51 220.53 661.59
4 4 16 64 256 75.39 301.56 1206.24
5 5 25 125 625 70.57 352.85 1764.25
6 6 36 216 1296 68.13 408.78 2452.68
7 7 49 343 2401 69.89 489.23 3424.61
8 8 64 512 4096 73.59 588.72 4709.76
9 9 81 729 6561 73.78 664.02 5976.18
10 10 100 1000 10000 74.13 741.30 7413.00
11 11 121 1331 14641 74.34 817.74 8995.14
12 12 144 1728 20736 74.87 898.44 10781.28
Suma por
columna
𝟕𝟖
∑𝒊=𝟏
𝟏𝟐
𝒙𝒊
𝟔𝟓𝟎
∑𝒊=𝟏
𝟏𝟐
𝒙𝒊
𝟐
𝟔𝟎𝟖𝟒
∑𝒊=𝟏
𝟏𝟐
𝒙𝒊
𝟑
𝟔𝟎𝟕𝟏𝟎
∑𝒊=𝟏
𝟏𝟐
𝒙𝒊
𝟒
𝟖𝟗𝟗. 𝟒𝟖
∑𝒊=𝟏
𝟏𝟐
𝒚𝒊
𝟓𝟕𝟑𝟕. 𝟏𝟑
∑𝒊=𝟏
𝟏𝟐
𝒙𝒊 𝒚𝒊
𝟒𝟕𝟖𝟎𝟒. 𝟎𝟓
∑𝒊=𝟏
𝟏𝟐
𝒙𝒊
𝟐
𝒚𝒊
Entonces, las ecuaciones normales para el caso del ajuste polinomial cuadrático están dadas
por la ecuación … (𝟐𝟐):
[
𝟏𝟐 ∑𝒊=𝟏
𝟏𝟐
𝒙𝒊 ∑𝒊=𝟏
𝟏𝟐
𝒙𝒊
𝟐
∑𝒊=𝟏
𝟏𝟐
𝒙𝒊 ∑𝒊=𝟏
𝟏𝟐
𝒙𝒊
𝟐
∑𝒊=𝟏
𝟏𝟐
𝒙𝒊
𝟑
∑𝒊=𝟏
𝟏𝟐
𝒙𝒊
𝟐
∑𝒊=𝟏
𝟏𝟐
𝒙𝒊
𝟑
∑𝒊=𝟏
𝟏𝟐
𝒙𝒊
𝟒
]
[
𝒂 𝟎
𝒂 𝟏
𝒂 𝟐
] =
[
∑𝒊=𝟏
𝟏𝟐
𝒚𝒊
∑𝒊=𝟏
𝟏𝟐
𝒙𝒊 𝒚𝒊
∑𝒊=𝟏
𝟏𝟐
𝒙𝒊
𝟐
𝒚𝒊]
… (𝟒𝟎)
Para resolver el sistema de ecuaciones … (𝟒𝟎) de este ajuste polinomial cuadrático, se
emplea el software Matrixcalc: https://matrixcalc.org/es/slu.html cuya indicación a ejecutar
es el Método de la matriz inversa en relación a la forma de la ecuación … (𝟐𝟐), por lo que en
este caso se define, como:
18
𝑨 ∙ 𝒂̂ = 𝑩 →∴ 𝒂̂ = 𝑨−𝟏
∙ 𝑩 → [
𝒂 𝟎
𝒂 𝟏
𝒂 𝟐
] = [
𝑵 ∑𝒊=𝟏
𝑵
𝒙𝒊 ∑𝒊=𝟏
𝑵
𝒙𝒊
𝟐
∑𝒊=𝟏
𝑵
𝒙𝒊 ∑𝒊=𝟏
𝑵
𝒙𝒊
𝟐
∑𝒊=𝟏
𝑵
𝒙𝒊
𝟑
∑𝒊=𝟏
𝑵
𝒙𝒊
𝟐
∑𝒊=𝟏
𝑵
𝒙𝒊
𝟑
∑𝒊=𝟏
𝑵
𝒙𝒊
𝟒
]
−𝟏
[
∑𝒊=𝟏
𝑵
𝒚𝒊
∑𝒊=𝟏
𝑵
𝒙𝒊 𝒚𝒊
∑𝒊=𝟏
𝑵
𝒙𝒊
𝟐
𝒚𝒊
] … (𝟒𝟏)
5. Resultados
En este caso la forma matricial de la ecuación … (𝟒𝟎) se define como los valores de las
sumatorias encontradas en la Tabla 7 y esto se sustituye respectivamente de la siguiente
manera:
[
𝟏𝟐 𝟕𝟖 𝟔𝟓𝟎
𝟕𝟖 𝟔𝟓𝟎 𝟔𝟎𝟖𝟒
𝟔𝟓𝟎 𝟔𝟎𝟖𝟒 𝟔𝟎𝟕𝟏𝟎
] [
𝒂 𝟎
𝒂 𝟏
𝒂 𝟐
] = [
𝟖𝟗𝟗. 𝟒𝟖
𝟓𝟕𝟑𝟕. 𝟏𝟑
𝟒𝟕𝟖𝟎𝟒. 𝟎𝟓
] … (𝟒𝟐)
Realizando la multiplicación matricial en el lado izquierdo de la ecuación … (𝟒𝟐) nos
conduce a resolver un sistema de ecuaciones, para encontrar los coeficientes respectivos de
este ajuste polinomial cuadrático:
𝟏𝟐𝒂 𝟎 +
𝟕𝟖𝒂 𝟎 +
𝟔𝟓𝟎𝒂 𝟎 +
𝟕𝟖 𝒂 𝟏 +
𝟔𝟓𝟎𝒂 𝟏 +
𝟔𝟎𝟖𝟒𝒂 𝟏 +
𝟔𝟓𝟎𝒂 𝟐 =
𝟔𝟎𝟖𝟒𝒂 𝟐 =
𝟔𝟎𝟕𝟏𝟎𝒂 𝟐 =
𝟖𝟗𝟗. 𝟒𝟖
𝟓𝟕𝟑𝟕. 𝟏𝟑
𝟒𝟕𝟖𝟎𝟒. 𝟎𝟓
… (𝟒𝟑)
Entonces, considerando los valores matriciales de la ecuación … (𝟒𝟐), como:
𝑨 = [
𝟏𝟐 𝟕𝟖 𝟔𝟓𝟎
𝟕𝟖 𝟔𝟓𝟎 𝟔𝟎𝟖𝟒
𝟔𝟓𝟎 𝟔𝟎𝟖𝟒 𝟔𝟎𝟕𝟏𝟎
] ; 𝑩 = [
𝟖𝟗𝟗. 𝟒𝟖
𝟓𝟕𝟑𝟕. 𝟏𝟑
𝟒𝟕𝟖𝟎𝟒. 𝟎𝟓
] … (𝟒𝟒)
Luego se calcula la inversa de 𝐴 en el software Matrixcalc:
𝑨−𝟏
=
[
𝟒𝟕
𝟒𝟒
−
𝟏𝟓
𝟒𝟒
𝟏
𝟒𝟒
−
𝟏𝟓
𝟒𝟒
𝟓𝟑𝟓
𝟒𝟎𝟎𝟒
−
𝟑
𝟑𝟎𝟖
𝟏
𝟒𝟒
−
𝟑
𝟑𝟎𝟖
𝟑
𝟒𝟎𝟎𝟒 ]
… (𝟒𝟓)
Por lo tanto, se procede a encontrar los coeficientes del ajuste cuadrático en el software
Matrixcalc:
19
𝒂̂ = 𝑨−𝟏
∙ 𝑩 → [
𝒂 𝟎
𝒂 𝟏
𝒂 𝟐
] =
[
𝟒𝟕
𝟒𝟒
−
𝟏𝟓
𝟒𝟒
𝟏
𝟒𝟒
−
𝟏𝟓
𝟒𝟒
𝟓𝟑𝟓
𝟒𝟎𝟎𝟒
−
𝟑
𝟑𝟎𝟖
𝟏
𝟒𝟒
−
𝟑
𝟑𝟎𝟖
𝟑
𝟒𝟎𝟎𝟒 ]
∙ [
𝟖𝟗𝟗. 𝟒𝟖
𝟓𝟕𝟑𝟕. 𝟏𝟑
𝟒𝟕𝟖𝟎𝟒. 𝟎𝟓
] =
[
𝟐𝟎𝟏𝟏𝟑𝟑
𝟐𝟐𝟎𝟎
−
𝟖𝟏𝟑𝟕
𝟏𝟒𝟑𝟎
𝟓𝟒𝟏𝟕
𝟏𝟒𝟑𝟎𝟎 ]
… (𝟒𝟔)
En la ecuación … (𝟒𝟔) se encuentra la solución, para los coeficientes del ajuste polinomial
cuadrático, que está dado por:
𝒂 𝟎 = 𝟗𝟏. 𝟒𝟐𝟒𝟎𝟗, 𝒂 𝟏 = −𝟓. 𝟔𝟗𝟎𝟐𝟏, 𝒂 𝟐 = 𝟎. 𝟑𝟕𝟖𝟖𝟏 … (𝟒𝟕)
Por lo tanto, se relaciona los coeficientes encontrados en … (𝟒𝟕) para sustituirlos en el mejor
modelo de ajuste polinomial cuadrático:
𝒚̂ = 𝒂 𝟎 + 𝒂 𝟏 𝒙 + 𝒂 𝟐 𝒙 𝟐
→∴ 𝒚̂ = 𝟗𝟏. 𝟒𝟐𝟒𝟎𝟗 − 𝟓. 𝟔𝟗𝟎𝟐𝟏𝒙 + 𝟎. 𝟑𝟕𝟖𝟖𝟏𝒙 𝟐
… (𝟒𝟖)
Esta ecuación … (𝟒𝟖) implica encontrar los probables intervalos de predicción al 95% de
confianza sobre el porcentaje de la deserción estudiantil para esta dependencia, que está dado
por la ecuación … (𝟑𝟒):
𝒚 𝒑 = 𝑿 𝒑 𝒂̂ ± 𝒕 𝟎.𝟗𝟕𝟓
𝟏𝟐−(𝟐+𝟏)
𝝈̂√𝟏 + 𝑿 𝒑(𝑿 𝑻 𝑿)−𝟏 𝑿 𝒑
𝑻 … (𝟒𝟗)
Después en la ecuación … (𝟒𝟗) se realiza operaciones correspondientes en el lado derecho
de la bivalencia ± :
𝒚 𝒑 = 𝑿 𝒑 𝒂̂ ± 𝒕 𝟎.𝟗𝟕𝟓
𝟗
(√
𝒀 𝑻 𝒀 − 𝒂̂ 𝑻 𝑿 𝑻 𝒀
𝟏𝟐 − (𝟐 + 𝟏)
) √𝟏 + 𝑿 𝒑(𝑿 𝑻 𝑿)−𝟏 𝑿 𝒑
𝑻 … (𝟓𝟎)
Esto implica, encontrar el percentil de la distribución 𝑡 Student, que en este caso se define
como: 𝒕 𝟎.𝟗𝟕𝟓
𝟗
, por lo que este valor, se corrobora mediante el software wólfram alpha:
http://www.wolframalpha.com/ de la siguiente manera:
97.5 Percentile Student´s t distribution degrees of freedom 9
Esta sintaxis a ejecutar, da el valor correspondiente de 𝒕 𝟎.𝟗𝟕𝟓
𝟗
= 𝟐. 𝟐𝟔𝟐𝟏𝟔 … (𝟓𝟏)
Luego, se procede a calcular el error de la estimación:
𝝈̂ = √
𝒀 𝑻 𝒀 − 𝒂̂ 𝑻 𝑿 𝑻 𝒀
𝟗
… (𝟓𝟐)
20
Para obtener la suma de cuadrados del error (𝑺𝑪𝑬), se define, para este caso de ajuste
polinomial cuadrático, los elementos matriciales del numerador de la ecuación … (𝟓𝟐), por
lo tanto se emplea el software Matrixcalc: https://matrixcalc.org/es/slu.html de la siguiente
forma:
𝑿 =
[
𝟏
𝟏
⋮
𝟏
𝒙 𝟏
𝒙 𝟐
⋮
𝒙 𝟏𝟐
𝒙 𝟏
𝟐
𝒙 𝟐
𝟐
⋮
𝒙 𝟏𝟐
𝟐
]
=
[
𝟏
𝟏
𝟏
𝟏
𝟏
𝟏
𝟏
𝟏
𝟏
𝟏
𝟏
𝟏
𝟏
𝟐
𝟑
𝟒
𝟓
𝟔
𝟕
𝟖
𝟗
𝟏𝟎
𝟏𝟏
𝟏𝟐
𝟏
𝟒
𝟗
𝟏𝟔
𝟐𝟓
𝟑𝟔
𝟒𝟗
𝟔𝟒
𝟖𝟏
𝟏𝟎𝟎
𝟏𝟐𝟏
𝟏𝟒𝟒]
→∴ 𝑿 𝑻
= [
𝟏
𝟏
𝟏
𝟏
𝟐
𝟒
𝟏
𝟑
𝟗
𝟏
𝟒
𝟏𝟔
𝟏
𝟓
𝟐𝟓
𝟏
𝟔
𝟑𝟔
𝟏
𝟕
𝟒𝟗
𝟏
𝟖
𝟔𝟒
𝟏
𝟗
𝟖𝟏
𝟏
𝟏𝟎
𝟏𝟎𝟎
𝟏
𝟏𝟏
𝟏𝟐𝟏
𝟏
𝟏𝟐
𝟏𝟒𝟒
]
𝒀 = [
𝒚 𝟏
𝒚 𝟐
⋮
𝒚 𝟏𝟐
] =
[
𝟖𝟖. 𝟔𝟎
𝟖𝟐. 𝟔𝟖
𝟕𝟑. 𝟓𝟏
𝟕𝟓. 𝟑𝟗
𝟕𝟎. 𝟓𝟕
𝟔𝟖. 𝟏𝟑
𝟔𝟗. 𝟖𝟗
𝟕𝟑. 𝟓𝟗
𝟕𝟑. 𝟕𝟖
𝟕𝟒. 𝟏𝟑
𝟕𝟒. 𝟑𝟒
𝟕𝟒. 𝟖𝟕]
→∴ 𝒀 𝑻
= [ 𝟖𝟖. 𝟔𝟎 𝟖𝟐. 𝟔𝟖 𝟕𝟑. 𝟓𝟏 𝟕𝟓. 𝟑𝟗 𝟕𝟎. 𝟓𝟕 𝟔𝟖. 𝟏𝟑 𝟔𝟗. 𝟖𝟗 𝟕𝟑. 𝟓𝟗 𝟕𝟑. 𝟕𝟖 𝟕𝟒. 𝟏𝟑 𝟕𝟒. 𝟑𝟒 𝟕𝟒. 𝟖𝟕]
𝒂̂ = [
𝒂 𝟎
𝒂 𝟏
𝒂 𝟐
] = [
𝟗𝟏. 𝟒𝟐𝟒𝟎𝟗
−𝟓. 𝟔𝟗𝟎𝟐𝟏
𝟎. 𝟑𝟕𝟖𝟖𝟏
] →∴ 𝒂̂ 𝑻
= [ 𝟗𝟏. 𝟒𝟐𝟒𝟎𝟗 −𝟓. 𝟔𝟗𝟎𝟐𝟏 𝟎. 𝟑𝟕𝟖𝟖𝟏]
… (𝟓𝟑)
Esto implica, sustituir los elementos matriciales de la ecuación … (𝟓𝟑), para poder efectuar
la operación matricial del numerador de la ecuación … (𝟓𝟐) con el software Matrixcalc:
https://matrixcalc.org/es/slu.html de la siguiente manera:
𝒀 𝑻
𝒀 = 𝟔𝟕𝟕𝟔𝟓. 𝟗
𝒂̂ 𝑻
𝑿 𝑻
𝒀 = 𝟔𝟕𝟔𝟗𝟕. 𝟑
→
𝝈̂ = √
𝟔𝟕𝟕𝟔𝟓. 𝟗 − 𝟔𝟕𝟔𝟗𝟕. 𝟑
𝟗
𝜎̂ = √
68.6
9
→∴ 𝜎̂ = √7.62222
𝝈̂ = 𝟐. 𝟕𝟔𝟎
… (𝟓𝟒)
Por lo tanto, se sustituye los valores de las ecuaciones … (𝟓𝟏) y … (𝟓𝟒) en el intervalo de
predicción de la ecuación … (𝟓𝟎):
𝒚 𝒑 = 𝑿 𝒑 𝒂̂ ± ( 𝟐. 𝟐𝟔𝟐𝟏𝟔)( 𝟐. 𝟕𝟔𝟎)√ 𝟏 + 𝑿 𝒑( 𝑿 𝑻
𝑿)
−𝟏
𝑿 𝒑
𝑻
… (𝟓𝟓)
El intervalo de predicción de la ecuación … (𝟓𝟓) define el pronóstico para las generaciones
del 2013 al 2014:
21
Para la generación 2013.
En este caso, se define el pronóstico como un valor discreto, por lo tanto, 𝑝 = 13 y este se
sustituye en la ecuación … (𝟓𝟓):
𝒚 𝟏𝟑 = 𝑿 𝟏𝟑 𝒂̂ ± (𝟐. 𝟐𝟔𝟐𝟏𝟔)(𝟐. 𝟕𝟔𝟎)√𝟏 + 𝑿 𝟏𝟑(𝑿 𝑻 𝑿)−𝟏 𝑿 𝟏𝟑
𝑻
… (𝟓𝟔)
Entonces, para esta generación, su matriz pronóstico, que se define en la ecuación … (𝟑𝟒)
es:
𝑿 𝟏𝟑 = [ 𝟏 𝒙 𝟏𝟑 ⋯ 𝒙 𝟏𝟑
𝟐 ] → 𝑿 𝟏𝟑 = [ 𝟏 𝟏𝟑 𝟏𝟔𝟗] →∴ 𝑿 𝟏𝟑
𝑻
= [
𝟏
𝟏𝟑
𝟏𝟔𝟗
] … (𝟓𝟕)
Esto implica, encontrar la operación matricial 𝑿 𝟏𝟑 𝒂̂ , considerando el elemento matricial 𝑿 𝟏𝟑
de la ecuación … (𝟓𝟕) y el elemento matricial 𝒂̂ definido en la ecuación … (𝟓𝟑) y estos
elementos matriciales se sustituyen en la ecuación … (𝟓𝟔):
𝒚 𝟏𝟑 = [ 𝟏 𝟏𝟑 𝟏𝟔𝟗] [
𝟗𝟏. 𝟒𝟐𝟒𝟎𝟗
−𝟓. 𝟔𝟗𝟎𝟐𝟏
𝟎. 𝟑𝟕𝟖𝟖𝟏
] ± (𝟐. 𝟐𝟔𝟐𝟏𝟔)(𝟐. 𝟕𝟔𝟎)√𝟏 + 𝑿 𝟏𝟑(𝑿 𝑻 𝑿)−𝟏 𝑿 𝟏𝟑
𝑻
… (𝟓𝟖)
En la ecuación … (𝟓𝟖) se realiza su operación matricial del lado izquierdo de la bivalencia
± con el software wólfram alpha: http://www.wolframalpha.com/ donde se ejecuta la
siguiente instrucción:
{{1,13,169}}*{{91.42409},{-5.69021},{0.37881}}
Esta sintaxis, da el resultado de esta operación matricial y por lo tanto este valor resultante
se sustituye en la ecuación … (𝟓𝟖):
𝒚 𝟏𝟑 = 𝟖𝟏. 𝟒𝟕𝟎 ± (𝟐. 𝟐𝟔𝟐𝟏𝟔)(𝟐. 𝟕𝟔𝟎)√𝟏 + 𝑿 𝟏𝟑(𝑿 𝑻 𝑿)−𝟏 𝑿 𝟏𝟑
𝑻
… (𝟓𝟗)
Luego, se efectúa la operación matricial √𝟏 + 𝑿 𝟏𝟑(𝑿 𝑻 𝑿)−𝟏 𝑿 𝟏𝟑
𝑻
, considerando el elemento
matricial 𝑿 𝟏𝟑 de la ecuación … (𝟓𝟕) y los elementos matriciales 𝑿, 𝑿 𝑻
que están definidos
en la ecuación … (𝟓𝟑) y estos elementos matriciales se sustituyen en la ecuación … (𝟓𝟗):
𝒚 𝟏𝟑 = 𝟖𝟏. 𝟒𝟕𝟎 ± (𝟐. 𝟐𝟔𝟐𝟏𝟔)(𝟐. 𝟕𝟔𝟎)
√
𝟏 + [ 𝟏 𝟏𝟑 𝟏𝟔𝟗]
(
[
𝟏
𝟏
𝟏
𝟏
𝟐
𝟒
𝟏
𝟑
𝟗
𝟏
𝟒
𝟏𝟔
𝟏
𝟓
𝟐𝟓
𝟏
𝟔
𝟑𝟔
𝟏
𝟕
𝟒𝟗
𝟏
𝟖
𝟔𝟒
𝟏
𝟗
𝟖𝟏
𝟏
𝟏𝟎
𝟏𝟎𝟎
𝟏
𝟏𝟏
𝟏𝟐𝟏
𝟏
𝟏𝟐
𝟏𝟒𝟒
]
[
𝟏
𝟏
𝟏
𝟏
𝟏
𝟏
𝟏
𝟏
𝟏
𝟏
𝟏
𝟏
𝟏
𝟐
𝟑
𝟒
𝟓
𝟔
𝟕
𝟖
𝟗
𝟏𝟎
𝟏𝟏
𝟏𝟐
𝟏
𝟒
𝟗
𝟏𝟔
𝟐𝟓
𝟑𝟔
𝟒𝟗
𝟔𝟒
𝟖𝟏
𝟏𝟎𝟎
𝟏𝟐𝟏
𝟏𝟒𝟒])
−𝟏
[
𝟏
𝟏𝟑
𝟏𝟔𝟗
] … (𝟔𝟎)
22
Después, se realiza la multiplicación de matrices del paréntesis de la ecuación … (𝟔𝟎) con
el software Matrixcalc: https://matrixcalc.org/es/slu.html y por lo tanto esta multiplicación
matricial resulta:
𝒚 𝟏𝟑 = 𝟖𝟏. 𝟒𝟕𝟎 ± (𝟐. 𝟐𝟔𝟐𝟏𝟔)(𝟐. 𝟕𝟔𝟎)√ 𝟏 + [ 𝟏 𝟏𝟑 𝟏𝟔𝟗] ([
𝟏𝟐
𝟕𝟖
𝟔𝟓𝟎
𝟕𝟖
𝟔𝟓𝟎
𝟔𝟎𝟖𝟒
𝟔𝟓𝟎
𝟔𝟎𝟖𝟒
𝟔𝟎𝟕𝟏𝟎
])
−𝟏
[
𝟏
𝟏𝟑
𝟏𝟔𝟗
] … (𝟔𝟏)
Esto implica, efectuar las operaciones matriciales del radicando de la ecuación … (𝟔𝟏)
mediante el software wólfram alpha: http://www.wolframalpha.com/ donde se ejecuta la
siguiente instrucción:
{{1,13,169}}*inverse({{12,78,650},{78,650,6084},{650,6084,60710}})*{{1},{13},{169}}
Esta sintaxis, da el resultado de esta operación matricial y por lo tanto este valor resultante
se sustituye en la ecuación … (𝟔𝟏):
𝒚 𝟏𝟑 = 𝟖𝟏. 𝟒𝟕𝟎 ± (𝟐. 𝟐𝟔𝟐𝟏𝟔)(𝟐. 𝟕𝟔𝟎)√𝟏 + 𝟏. 𝟎𝟔𝟖𝟏𝟖 … (𝟔𝟐)
Realizando operaciones elementales en el radicando de la ecuación … (𝟔𝟐):
𝒚 𝟏𝟑 = 𝟖𝟏. 𝟒𝟕𝟎 ± (𝟐. 𝟐𝟔𝟐𝟏𝟔)(𝟐. 𝟕𝟔𝟎)√𝟐. 𝟎𝟔𝟖𝟏𝟖 … (𝟔𝟑)
Se encuentra la raíz cuadrada de la ecuación … (𝟔𝟑):
𝒚 𝟏𝟑 = 𝟖𝟏. 𝟒𝟕𝟎 ± (𝟐. 𝟐𝟔𝟐𝟏𝟔)(𝟐. 𝟕𝟔𝟎)(𝟏. 𝟒𝟑𝟖𝟏𝟏𝟔𝟖𝟐𝟒) … (𝟔𝟒)
Luego, se efectúa la multiplicación del lado derecho de la bivalencia ± de la ecuación
… (𝟔𝟒):
𝒚 𝟏𝟑 = 𝟖𝟏. 𝟒𝟕𝟎 ± 𝟖. 𝟗𝟕𝟖 … (𝟔𝟓)
Finalmente, el resultado del intervalo de predicción de la ecuación … (𝟔𝟓) se interpreta de
acuerdo a la definición del orden bivalente ± de la ecuación … (𝟑𝟓):
81.470 − 8.978 ≤ 𝑦13 ≤ 81.470 + 8.978 →∴ 𝟕𝟐. 𝟒𝟗% ≤ 𝒚 𝟏𝟑 ≤ 𝟗𝟎. 𝟒𝟒% … (𝟔𝟔)
Para la generación 2014.
En este caso, se define el pronóstico como un valor discreto, por lo tanto, 𝑝 = 14 y este se
sustituye en la ecuación … (𝟓𝟓):
𝒚 𝟏𝟒 = 𝑿 𝟏𝟒 𝒂̂ ± (𝟐. 𝟐𝟔𝟐𝟏𝟔)(𝟐. 𝟕𝟔𝟎)√ 𝟏 + 𝑿 𝟏𝟒(𝑿 𝑻 𝑿)−𝟏 𝑿 𝟏𝟒
𝑻
… (𝟔𝟕)
23
Entonces, para esta generación, su matriz pronóstico, que se define en la ecuación … (𝟑𝟒)
es:
𝑿 𝟏𝟒 = [𝟏 𝒙 𝟏𝟒 ⋯ 𝒙 𝟏𝟒
𝟐 ] → 𝑿 𝟏𝟒 = [ 𝟏 𝟏𝟒 𝟏𝟗𝟔] →∴ 𝑿 𝟏𝟒
𝑻
= [
𝟏
𝟏𝟒
𝟏𝟗𝟔
] … (𝟔𝟖)
Esto implica, encontrar la operación matricial 𝑿 𝟏𝟒 𝒂̂ , considerando el elemento matricial 𝑿 𝟏𝟒
de la ecuación … (𝟔𝟖) y el elemento matricial 𝒂̂ definido en la ecuación … (𝟓𝟑) y estos
elementos matriciales se sustituyen en la ecuación … (𝟔𝟕):
𝒚 𝟏𝟒 = [ 𝟏 𝟏𝟒 𝟏𝟗𝟔] [
𝟗𝟏. 𝟒𝟐𝟒𝟎𝟗
−𝟓. 𝟔𝟗𝟎𝟐𝟏
𝟎. 𝟑𝟕𝟖𝟖𝟏
] ± (𝟐. 𝟐𝟔𝟐𝟏𝟔)(𝟐. 𝟕𝟔𝟎)√ 𝟏 + 𝑿 𝟏𝟒(𝑿 𝑻 𝑿)−𝟏 𝑿 𝟏𝟒
𝑻
… (𝟔𝟗)
En la ecuación … (𝟔𝟗) se realiza su operación matricial del lado izquierdo de la bivalencia
± con el software wólfram alpha: http://www.wolframalpha.com/ donde se ejecuta la
siguiente instrucción:
{{1,14,196}}*{{91.42409},{-5.69021},{0.37881}}
Esta sintaxis, da el resultado de esta operación matricial y por lo tanto este valor resultante
se sustituye en la ecuación … (𝟔𝟗):
𝒚 𝟏𝟒 = 𝟖𝟔. 𝟎𝟎𝟖 ± (𝟐. 𝟐𝟔𝟐𝟏𝟔)(𝟐. 𝟕𝟔𝟎)√ 𝟏 + 𝑿 𝟏𝟒(𝑿 𝑻 𝑿)−𝟏 𝑿 𝟏𝟒
𝑻
… (𝟕𝟎)
Luego, se efectúa la operación matricial √𝟏 + 𝑿 𝟏𝟒(𝑿 𝑻 𝑿)−𝟏 𝑿 𝟏𝟒
𝑻
, considerando el elemento
matricial 𝑿 𝟏𝟒 de la ecuación … (𝟔𝟖) y los elementos matriciales 𝑿, 𝑿 𝑻
que están definidos
en la ecuación … (𝟓𝟑) y estos elementos matriciales se sustituyen en la ecuación … (𝟕𝟎):
𝒚 𝟏𝟒 = 𝟖𝟔. 𝟎𝟎𝟖 ± (𝟐. 𝟐𝟔𝟐𝟏𝟔)(𝟐. 𝟕𝟔𝟎)
√
𝟏 + [ 𝟏 𝟏𝟒 𝟏𝟗𝟔]
(
[
𝟏
𝟏
𝟏
𝟏
𝟐
𝟒
𝟏
𝟑
𝟗
𝟏
𝟒
𝟏𝟔
𝟏
𝟓
𝟐𝟓
𝟏
𝟔
𝟑𝟔
𝟏
𝟕
𝟒𝟗
𝟏
𝟖
𝟔𝟒
𝟏
𝟗
𝟖𝟏
𝟏
𝟏𝟎
𝟏𝟎𝟎
𝟏
𝟏𝟏
𝟏𝟐𝟏
𝟏
𝟏𝟐
𝟏𝟒𝟒
]
[
𝟏
𝟏
𝟏
𝟏
𝟏
𝟏
𝟏
𝟏
𝟏
𝟏
𝟏
𝟏
𝟏
𝟐
𝟑
𝟒
𝟓
𝟔
𝟕
𝟖
𝟗
𝟏𝟎
𝟏𝟏
𝟏𝟐
𝟏
𝟒
𝟗
𝟏𝟔
𝟐𝟓
𝟑𝟔
𝟒𝟗
𝟔𝟒
𝟖𝟏
𝟏𝟎𝟎
𝟏𝟐𝟏
𝟏𝟒𝟒])
−𝟏
[
𝟏
𝟏𝟒
𝟏𝟗𝟔
] … (𝟕𝟏)
Después, se realiza la multiplicación de matrices del paréntesis de la ecuación … (𝟕𝟏) y por
lo tanto esta multiplicación matricial resulta:
𝒚 𝟏𝟒 = 𝟖𝟔. 𝟎𝟎𝟖 ± (𝟐. 𝟐𝟔𝟐𝟏𝟔)(𝟐. 𝟕𝟔𝟎)√ 𝟏 + [ 𝟏 𝟏𝟒 𝟏𝟗𝟔] ([
𝟏𝟐
𝟕𝟖
𝟔𝟓𝟎
𝟕𝟖
𝟔𝟓𝟎
𝟔𝟎𝟖𝟒
𝟔𝟓𝟎
𝟔𝟎𝟖𝟒
𝟔𝟎𝟕𝟏𝟎
])
−𝟏
[
𝟏
𝟏𝟒
𝟏𝟗𝟔
] … (𝟕𝟐)
24
Esto implica, efectuar las operaciones matriciales del radicando de la ecuación … (𝟕𝟐)
mediante el software wólfram alpha: http://www.wolframalpha.com/ donde se ejecuta la
siguiente instrucción:
{{1,14,196}}*inverse({{12,78,650},{78,650,6084},{650,6084,60710}})*{{1},{14},{196}}
Esta sintaxis, da el resultado de esta operación matricial y por lo tanto este valor resultante
se sustituye en la ecuación … (𝟕𝟐):
𝒚 𝟏𝟒 = 𝟖𝟔. 𝟎𝟎𝟖 ± (𝟐. 𝟐𝟔𝟐𝟏𝟔)(𝟐. 𝟕𝟔𝟎)√𝟏 + 𝟏. 𝟗𝟒𝟗𝟑𝟎 … (𝟕𝟑)
Realizando operaciones elementales en el radicando de la ecuación … (𝟕𝟑):
𝒚 𝟏𝟒 = 𝟖𝟔. 𝟎𝟎𝟖 ± (𝟐. 𝟐𝟔𝟐𝟏𝟔)(𝟐. 𝟕𝟔𝟎)√𝟐. 𝟗𝟒𝟗𝟑𝟎 … (𝟕𝟒)
Se encuentra la raíz cuadrada de la ecuación … (𝟕𝟒):
𝒚 𝟏𝟒 = 𝟖𝟔. 𝟎𝟎𝟖 ± (𝟐. 𝟐𝟔𝟐𝟏𝟔)(𝟐. 𝟕𝟔𝟎)(𝟏. 𝟕𝟏𝟕𝟑𝟓𝟐𝟔𝟏𝟒) … (𝟕𝟓)
Luego, se efectúa la multiplicación del lado derecho de la bivalencia ± de la ecuación
… (𝟕𝟓):
𝒚 𝟏𝟒 = 𝟖𝟔. 𝟎𝟎𝟖 ± 𝟏𝟎. 𝟕𝟐𝟐 … (𝟕𝟔)
Finalmente, el resultado del intervalo de predicción de la ecuación … (𝟕𝟔) se interpreta de
acuerdo a la definición del orden bivalente ± de la ecuación … (𝟑𝟓):
86.008 − 10.722 ≤ 𝑦14 ≤ 86.008 + 10.722 →∴ 𝟕𝟓. 𝟐𝟖% ≤ 𝒚 𝟏𝟒 ≤ 𝟗𝟔. 𝟕𝟑% … (𝟕𝟕)
Estos intervalos de predicción de las ecuaciones … (𝟔𝟔) y … (𝟕𝟕) se corrobora mediante el
software de Octave-MATLAB desde: http://octave-online.net/ donde se consideran las
siguientes instrucciones definidas a ejecutar:
 [p,S] = polyfit(x,y,n): Da los coeficientes del polinomio p de grado n que se
encontró manualmente en la ecuación … (𝟒𝟖) que ajusta los puntos (x,y) por
mínimos cuadrados, con errores estimados S
 [Y,D] = polyconf(p,X,S,alpha): Predicción polinómica con intervalos de
confianza Y±D de la salida S dada por polyfit con nivel de confianza alpha
(considerando la ecuación … (𝟑𝟒), se menciona que es del 95%, es decir 0.05)
Estas instrucciones definidas, implica introducir las variables de los puntos del ajuste
considerado, es decir (x,y)=(Generacion,Desercion) con el siguiente orden
fundamental:
octave:1>Desercion=[88.60,82.68,73.51,75.39,70.57,68.13,69.89,73.59,
73.78,74.13,74.34,74.87];
octave:2> Generacion=[1,2,3,4,5,6,7,8,9,10,11,12];
25
Luego, se agrega la instrucción de polyfit, definida en este caso como:
octave:3> [p,S] = polyfit(Generacion,Desercion,2)
p =
0.37881 -5.69021 91.42409
S =
scalar structure containing the fields:
yf =
Columns 1 through 8:
86.113 81.559 77.763 74.724 72.443 70.920 70.154
70.146
Columns 9 through 12:
70.896 72.403 74.668 77.690
X =
1 1 1
4 2 1
9 3 1
16 4 1
25 5 1
36 6 1
49 7 1
64 8 1
81 9 1
100 10 1
121 11 1
144 12 1
En efecto, estos resultados concuerdan con los obtenidos en las ecuaciones … (𝟒𝟖) y … (𝟓𝟑).
Por lo tanto, se corroboran los predichos intervalos estudiantiles en la generación 2013 y
2014 de desertores, esto implica considerar lo que se obtuvo de la implementación polyfit,
para que se encuentre la última instrucción definida:
octave:4> [Y,D] = polyconf(p,13,S,0.05)
Y = 81.470
D = 8.978
octave:5> [Y,D] = polyconf(p,14,S,0.05)
Y = 86.008
D = 10.722
26
Esta sintaxis ejecutada en el software de Octave-MATLAB, da certeza de nuestros resultados
obtenidos manualmente en las ecuaciones … (𝟔𝟔) y … (𝟕𝟕), a razón de que estos valores son
idénticos.
En este trabajo se ha partido de la premisa de que un modelo estadístico paramétrico se
encuentra especificado por medio del grado que determina el óptimo ajuste funcional
polinomial, que este se logra con las variables que presentan mayor correlación a los datos
incluidos y que el objetivo es realizar la estimación de intervalos predictivos, que dependen
principalmente del nivel de confianza al 95% y de su vía asociada al percentil de la
distribución 𝑡 de Student cuyos límites inferior y superior involucra qué para tamaños de
muestras grandes, varía los resultados generacionales del 2013 al 2014 de la deserción
estudiantil en la dependencia IEMSDF de la siguiente manera:
 Para la generación 2013 su intervalo predictivo porcentual de la ecuación … (𝟔𝟔), se
compara con el último valor obtenido en los datos del ajuste, es decir el porcentaje de
la generación 2012; por lo tanto, se menciona que para su límite inferior el valor se
considera optimista a razón de que es proporcional y en su límite superior el valor es
fatalista por que incrementa significativamente la deserción estudiantil.
 Para la generación 2014 su intervalo predictivo porcentual de la ecuación … (𝟕𝟕), se
compara en los respectivos límites del intervalo obtenido en la ecuación … (𝟔𝟔), por
lo tanto, se menciona que para su límite inferior el valor aumenta sustancialmente y
en su límite superior el valor es catastrófico porque sigue incrementando la deserción
estudiantil.
Estos resultados conforman una banda única de confianza en los límites respectivos del
intervalo, que refleja el error de muestreo de deserción estudiantil inherente al cálculo del
error estándar de su dispersión generacional, cuyo tratamiento informativo en su valor
porcentual, se interpreta a corto plazo, la cobertura de la eficacia terminal, cuya
determinación, busque alentar a la dependencia, en incentivar la flexibilidad del modelo
educativo en el sistema escolarizado, para considerar un panorama de permanencia a cada
alumno que esté en riesgo de abandonar su plantel y esto promueva el alcance de retomar la
facilitación de continuar los estudios con actitud comprometida, para que el aprendiz
adquiera un sentido de responsabilidad, que estimule en su ser una formación de seguridad
decisiva ante los conflictos de la vida, conllevando así, una visión de superación personal,
que le genere competitividad exitosa, para poder culminar el logro de certificar su egreso con
calidad trascendental al desarrollo profesional.
27
6. Conclusiones y futuras líneas de investigación
En este trabajo se desarrolló un análisis de regresión por el método de mínimos cuadrados,
que consistió en basar sus criterios de determinación, para generar una función polinomial
óptima de ajuste a los datos generacionales, respectivamente a la extrapolación de un
intervalo de predicción porcentual de estudiantes desertores, que:
 Puede tomar una variable objetivo fuera del ámbito temporal o espacial.
 Puede ser inferido a partir de un profundo estudio del pasado y aceptando que el
comportamiento de los agentes históricos no se modifica sustancialmente.
 Define cuál de los posibles valores futuros de la variable objetivo es más probable.
Como futuro trabajo, sería interesante investigar las diferentes variantes de este problema,
por ejemplo:
 Amplificar la visibilidad de este modelo en regresión múltiple, cuyas muestras
aleatorias sean el número de estudiantes que estén en situación de receso indefinido
y el número de estudiantes que están dados de baja por la Subdirección de
Administración Escolar del IEMSDF, para formular una hipótesis de comparación
que pueda inferir la verdadera causa de deserción estudiantil en la dependencia.
 Construir de este modelo una prueba de bondad de ajuste logístico de frecuencia
estudiantil que esté dado de baja en la dependencia y que esté considerado en la
situación de calidad indefinida de su receso en el plantel, para que muestre una
variable de respuesta binaria de determinación analítica que explique el factor de la
problemática que pueda tener el fenómeno de la deserción estudiantil del IEMSDF.
En mi opinión, este análisis brinda a las autoridades competentes de esta dependencia un
conjunto de técnicas estadísticas, que pueden complementar con su experiencia para el
pronóstico de las principales variables de decisión, así como otorgar criterios para formular
modelos que permitan explicar y predecir el comportamiento de los agentes involucrados a
la deserción estudiantil.
28
7. Referencias bibliográficas
 Anderson, David R. (2008) Estadística para Administración y Economía (10ª
Edición) Ed. Cengage Learning.
 Bittinger, Marvin L. (2002) Cálculo para Ciencias Económico-Administrativas. (7ª
Edición) Ed. Pearson Educación.
 Carrillo Ramírez, Teresa. (2008) Apuntes de Mínimos Cuadrados de la asignatura
de Métodos Numéricos II para la Licenciatura en Matemáticas Aplicadas y
Computación. Ed. FES-Acatlán-UNAM en: https://drive.google.com/file/d/0B-
8i8s0wQyqyYVRhUFBxUFI1OTQ/view?usp=sharing
 Cannavos, George C. (1988) Probabilidad y Estadística: Aplicaciones y Métodos.
(1ª Edición) Ed. McGraw-Hill Interamericana.
 Chapra, Steven C. (2011). Métodos numéricos para ingenieros. (6ª Edición) Ed.
McGraw-Hill Interamericana.
 Díaz Martínez, Juan Pablo (2015) Deserción Escolar en la Educación Media
Superior: Una aproximación logística Ed. UNAM-Facultad de Ciencias en:
http://132.248.9.195/ptd2015/junio/306158177/Index.html
 Figueroa García, Edith (2014) Métodos Probabilísticos de Optimización. Estado de
México, Municipio de Naucalpan de Juárez. Ed. UNAM-FES Acatlán-Ingeniería
Civil.
 Gerald, Curtis F. (2000) Análisis Numérico con aplicaciones. (6ª Edición) Ed.
Pearson Educación.
 Gujarati, Damodar N. (2010) Econometría (5ª Edición) Ed. McGraw-Hill
Interamericana.
 Hines, William W. (1996) Probabilidad y Estadística para Ingeniería y
Administración (2ª Edición) Ed. CECSA.
 Infante Gil, Said. (2012) Métodos Estadísticos: Un Enfoque Interdisciplinario. (3ª
Edición) Ed. La Gaya Ciencia-COLPOS-SAGARPA.
 Lara Maldonado, Pedro Daniel. (2016) Análisis Estadístico y Probabilístico de la
Deserción Escolar de los planteles del IEMSDF con amplio histórico generacional
mediante el método de regresión por Mínimos Cuadrados. Ed. SEP-SES-UnADM-
DCEIT-SECDMX-IEMSDF-GAM.I.-PBD en: https://drive.google.com/file/d/0B-
8i8s0wQyqyWlJEQjVHbjlobDQ/view?usp=sharing
 Levin, Richard I. (2004) Estadística para Administración y Economía. (7ª Edición)
Ed. Pearson Educación
 Marín Salguero, Rafael. (2013). Temas Selectos de Matemáticas Preuniversitarias:
“El Ajuste de Curvas funcionales por la vía del Método de Regresión por Mínimos
Cuadrados.” Ed. IEMSDF-GAM.I. en: https://drive.google.com/file/d/0B-
8i8s0wQyqyUVdzSXVyM1FkcVZlYVBqdkR3REdaaFZ2MWtz/view?usp=sha
ring
29
 Marín Salguero, Rafael. (2014). Matemáticas Preuniversitarias: “Probabilidad y
Estadística.” Ed. IEMSDF-GAM.I. en: https://drive.google.com/file/d/0B-
8i8s0wQyqyczRFOVhyRWk1R18wbHN1UlpQdGY2YkhPaFFF/view?usp=sha
ring
 Mathews, John H. (2000) Métodos Numéricos con MATLAB. (3ª Edición). Ed.
Prentice-Hall.
 Pérez López, César. (2002) MATLAB y sus aplicaciones en las ciencias y la
ingeniería. Ed. Pearson Educación S.A.
 Ponce de León Topete, María del Socorro. (2003) Guía para el seguimiento de
Trayectorias Escolares a Nivel Medio Superior y Superior. (1ª Edición) Ed. DGP-
UAEH, en http://intranet.uaeh.edu.mx/DGP/pdf/2_guia_trayectoria.pdf
 Quintana Hernández, Pedro Alberto. (2005) Métodos Numéricos con Aplicaciones
en Excel. Ed. Reverté-SEP-Gto. -ITC.
 Sistema de Información Mexicana del Distrito Federal, INFOMEXDF. (2016)
“Solicitud de Información Pública registrada y aprobada con el número de folio:
0311000001716; con los datos estadísticos estudiantiles del ingreso (apartado 4)) y
del egreso (apartado 3)) desde su primera generación hasta su última generación
en todos los planteles que la conforman.” Ed. DE-SAE-IEMSDF, en:
http://www.infomexdf.org.mx/flslayer/seguimiento/d90c0f2c/06cd56f7/Respuest
a%201716.pdf
 Smith W, Allen. (1988) Análisis Numérico. Ed. Prentice-Hall Hispanoamericana
S.A.
 Spiegel, Murray R. (1970) Teoría y problemas de Estadística (1ra. Edición) Serie de
Compendios Schaum Editorial McGraw-Hill.
 Valdés Prada, Francisco José. (2014) Breviario sobre Modelado Matemático. (1ª
Edición) Ed. CBI-UAM-Iztapalapa.
 Wackerly, Dennis D. (2010) Estadística Matemática con Aplicaciones. (7ª Edición)
Ed. Cengage Learning.

Más contenido relacionado

La actualidad más candente

Estadística para la investigación pedagógica
Estadística para la investigación pedagógicaEstadística para la investigación pedagógica
Estadística para la investigación pedagógicaJoanny Ibarbia Pardo
 
1.acuerdo pedagogico
1.acuerdo pedagogico1.acuerdo pedagogico
1.acuerdo pedagogicoximenatc24
 
1.acuerdo pedagogico
1.acuerdo pedagogico1.acuerdo pedagogico
1.acuerdo pedagogicoximenatc24
 
1.acuerdo pedagogico
1.acuerdo pedagogico1.acuerdo pedagogico
1.acuerdo pedagogicojeaqueline
 
Introduccion a la estadistica
Introduccion a la estadisticaIntroduccion a la estadistica
Introduccion a la estadisticawcartaya
 
Conclusiones de unidad 2 organización de los datos
Conclusiones de unidad 2 organización de los datosConclusiones de unidad 2 organización de los datos
Conclusiones de unidad 2 organización de los datosJohanna Garcia
 
Módulo 1 de Estadistica General de Forma Virtual.. 2012
Módulo 1 de Estadistica General de Forma Virtual.. 2012Módulo 1 de Estadistica General de Forma Virtual.. 2012
Módulo 1 de Estadistica General de Forma Virtual.. 2012hamlet mata mata
 
APUNTES DE ESTADISTICA DESCRIPTIVA
APUNTES DE ESTADISTICA DESCRIPTIVAAPUNTES DE ESTADISTICA DESCRIPTIVA
APUNTES DE ESTADISTICA DESCRIPTIVAWILSON VELASTEGUI
 
Organización de datos
Organización de datosOrganización de datos
Organización de datosneurofuzzy
 
Ebook de Estadistica con el SPSS Presentado por Hamlet Mata Mata
Ebook de Estadistica con el SPSS Presentado por Hamlet Mata Mata Ebook de Estadistica con el SPSS Presentado por Hamlet Mata Mata
Ebook de Estadistica con el SPSS Presentado por Hamlet Mata Mata hamlet mata mata
 
Blog, conceptos de programación, métodos estadísticos
Blog, conceptos de programación, métodos estadísticosBlog, conceptos de programación, métodos estadísticos
Blog, conceptos de programación, métodos estadísticosLauraOspina49
 
Conceptos de programación, métodos estadísticos.
Conceptos  de programación, métodos estadísticos.Conceptos  de programación, métodos estadísticos.
Conceptos de programación, métodos estadísticos.angiegabrielabastida
 
Blog, conceptos de programación y métodos estadísticos
Blog, conceptos  de programación y métodos estadísticosBlog, conceptos  de programación y métodos estadísticos
Blog, conceptos de programación y métodos estadísticosjohanespinosa6
 
Blog, conceptos de programación, métodos estadísticos (1)
Blog, conceptos de programación, métodos estadísticos (1)Blog, conceptos de programación, métodos estadísticos (1)
Blog, conceptos de programación, métodos estadísticos (1)LauraOspina49
 

La actualidad más candente (17)

Estadística para la investigación pedagógica
Estadística para la investigación pedagógicaEstadística para la investigación pedagógica
Estadística para la investigación pedagógica
 
7. metodologia y estadistica aplicada a la educacion
7. metodologia y estadistica aplicada a la educacion7. metodologia y estadistica aplicada a la educacion
7. metodologia y estadistica aplicada a la educacion
 
1.acuerdo pedagogico
1.acuerdo pedagogico1.acuerdo pedagogico
1.acuerdo pedagogico
 
1.acuerdo pedagogico
1.acuerdo pedagogico1.acuerdo pedagogico
1.acuerdo pedagogico
 
1.acuerdo pedagogico
1.acuerdo pedagogico1.acuerdo pedagogico
1.acuerdo pedagogico
 
Introduccion a la estadistica
Introduccion a la estadisticaIntroduccion a la estadistica
Introduccion a la estadistica
 
Conclusiones de unidad 2 organización de los datos
Conclusiones de unidad 2 organización de los datosConclusiones de unidad 2 organización de los datos
Conclusiones de unidad 2 organización de los datos
 
Módulo 1 de Estadistica General de Forma Virtual.. 2012
Módulo 1 de Estadistica General de Forma Virtual.. 2012Módulo 1 de Estadistica General de Forma Virtual.. 2012
Módulo 1 de Estadistica General de Forma Virtual.. 2012
 
APUNTES DE ESTADISTICA DESCRIPTIVA
APUNTES DE ESTADISTICA DESCRIPTIVAAPUNTES DE ESTADISTICA DESCRIPTIVA
APUNTES DE ESTADISTICA DESCRIPTIVA
 
Organización de datos
Organización de datosOrganización de datos
Organización de datos
 
Ebook de Estadistica con el SPSS Presentado por Hamlet Mata Mata
Ebook de Estadistica con el SPSS Presentado por Hamlet Mata Mata Ebook de Estadistica con el SPSS Presentado por Hamlet Mata Mata
Ebook de Estadistica con el SPSS Presentado por Hamlet Mata Mata
 
Estadistica
EstadisticaEstadistica
Estadistica
 
Estadística 1
Estadística                                                         1Estadística                                                         1
Estadística 1
 
Blog, conceptos de programación, métodos estadísticos
Blog, conceptos de programación, métodos estadísticosBlog, conceptos de programación, métodos estadísticos
Blog, conceptos de programación, métodos estadísticos
 
Conceptos de programación, métodos estadísticos.
Conceptos  de programación, métodos estadísticos.Conceptos  de programación, métodos estadísticos.
Conceptos de programación, métodos estadísticos.
 
Blog, conceptos de programación y métodos estadísticos
Blog, conceptos  de programación y métodos estadísticosBlog, conceptos  de programación y métodos estadísticos
Blog, conceptos de programación y métodos estadísticos
 
Blog, conceptos de programación, métodos estadísticos (1)
Blog, conceptos de programación, métodos estadísticos (1)Blog, conceptos de programación, métodos estadísticos (1)
Blog, conceptos de programación, métodos estadísticos (1)
 

Destacado

Reforma de la Educación Superior en el Perú
Reforma de la Educación Superior en el Perú Reforma de la Educación Superior en el Perú
Reforma de la Educación Superior en el Perú SINEACE
 
Fracaso escolar
Fracaso escolarFracaso escolar
Fracaso escolarNESTARIK
 
Indicadores educativos en venezuela
Indicadores educativos en venezuelaIndicadores educativos en venezuela
Indicadores educativos en venezuelanaile23
 
Desercion escolar
Desercion escolarDesercion escolar
Desercion escolarmarynsol
 
Indicadores De Gestion Escolar
Indicadores De Gestion EscolarIndicadores De Gestion Escolar
Indicadores De Gestion EscolarRocío Paredes
 
Relax of the Spartans Proposal
Relax of the Spartans ProposalRelax of the Spartans Proposal
Relax of the Spartans ProposalDani Morillo
 
Hi600 u06_inst_slides
Hi600 u06_inst_slidesHi600 u06_inst_slides
Hi600 u06_inst_slidesljmcneill33
 
Resultados Barrick Sudamérica 2011
Resultados Barrick Sudamérica 2011Resultados Barrick Sudamérica 2011
Resultados Barrick Sudamérica 2011barrickarg
 
Domingo Tercero de Adviento Ciclo A.
Domingo Tercero de Adviento Ciclo A.Domingo Tercero de Adviento Ciclo A.
Domingo Tercero de Adviento Ciclo A.Padre Enrique Camargo
 
Aporte Económico de Veladero y Pascua Lama
Aporte Económico de Veladero y Pascua LamaAporte Económico de Veladero y Pascua Lama
Aporte Económico de Veladero y Pascua Lamabarrickarg
 
Presentacion paleo
Presentacion paleoPresentacion paleo
Presentacion paleoANA CODINA
 
Guía 1 post.uach
Guía 1 post.uachGuía 1 post.uach
Guía 1 post.uachhutopikox
 
Era de computadores[1]
Era de computadores[1]Era de computadores[1]
Era de computadores[1]Jairo Paez
 

Destacado (20)

Reforma de la Educación Superior en el Perú
Reforma de la Educación Superior en el Perú Reforma de la Educación Superior en el Perú
Reforma de la Educación Superior en el Perú
 
Fracaso escolar
Fracaso escolarFracaso escolar
Fracaso escolar
 
Desercion escolar web (3)
Desercion escolar web (3)Desercion escolar web (3)
Desercion escolar web (3)
 
Indicadores educativos 2000 - 2011 INE
Indicadores educativos 2000 - 2011 INEIndicadores educativos 2000 - 2011 INE
Indicadores educativos 2000 - 2011 INE
 
Indicadores educativos en venezuela
Indicadores educativos en venezuelaIndicadores educativos en venezuela
Indicadores educativos en venezuela
 
Desercion escolar
Desercion escolarDesercion escolar
Desercion escolar
 
Indicadores De Gestion Escolar
Indicadores De Gestion EscolarIndicadores De Gestion Escolar
Indicadores De Gestion Escolar
 
Indicadores sector educativo
Indicadores sector educativoIndicadores sector educativo
Indicadores sector educativo
 
Lungs
LungsLungs
Lungs
 
Relax of the Spartans Proposal
Relax of the Spartans ProposalRelax of the Spartans Proposal
Relax of the Spartans Proposal
 
Muestrapintura
MuestrapinturaMuestrapintura
Muestrapintura
 
Hi600 u06_inst_slides
Hi600 u06_inst_slidesHi600 u06_inst_slides
Hi600 u06_inst_slides
 
Resultados Barrick Sudamérica 2011
Resultados Barrick Sudamérica 2011Resultados Barrick Sudamérica 2011
Resultados Barrick Sudamérica 2011
 
Domingo Tercero de Adviento Ciclo A.
Domingo Tercero de Adviento Ciclo A.Domingo Tercero de Adviento Ciclo A.
Domingo Tercero de Adviento Ciclo A.
 
Aplicacion
AplicacionAplicacion
Aplicacion
 
Aporte Económico de Veladero y Pascua Lama
Aporte Económico de Veladero y Pascua LamaAporte Económico de Veladero y Pascua Lama
Aporte Económico de Veladero y Pascua Lama
 
Presentacion paleo
Presentacion paleoPresentacion paleo
Presentacion paleo
 
Guía 1 post.uach
Guía 1 post.uachGuía 1 post.uach
Guía 1 post.uach
 
Comunicación humana en el infante
Comunicación humana en el infanteComunicación humana en el infante
Comunicación humana en el infante
 
Era de computadores[1]
Era de computadores[1]Era de computadores[1]
Era de computadores[1]
 

Similar a Pt2 definitivo a1_e2_pelm

Actividad 12 cosme_diego
Actividad 12 cosme_diegoActividad 12 cosme_diego
Actividad 12 cosme_diegoDiego cosme
 
Actividad 12 cosme_diego
Actividad 12 cosme_diegoActividad 12 cosme_diego
Actividad 12 cosme_diegoDiego cosme
 
Blog, conceptos de programación, métodos estadísticos (1)
Blog, conceptos de programación, métodos estadísticos (1)Blog, conceptos de programación, métodos estadísticos (1)
Blog, conceptos de programación, métodos estadísticos (1)valentinasatizabalar
 
Blog, conceptos de programación, métodos estadísticos (1)
Blog, conceptos de programación, métodos estadísticos (1)Blog, conceptos de programación, métodos estadísticos (1)
Blog, conceptos de programación, métodos estadísticos (1)daniela515873
 
Blog, conceptos de programación, métodos estadísticos (1)
Blog, conceptos de programación, métodos estadísticos (1)Blog, conceptos de programación, métodos estadísticos (1)
Blog, conceptos de programación, métodos estadísticos (1)SarahOrdez
 
Blog, conceptos de programación, métodos estadísticos (1)
Blog, conceptos de programación, métodos estadísticos (1)Blog, conceptos de programación, métodos estadísticos (1)
Blog, conceptos de programación, métodos estadísticos (1)daniela515873
 
Trabajo de informatica
Trabajo de informaticaTrabajo de informatica
Trabajo de informaticalauraflorez47
 
Guía para maestros: Una secuencia didáctica para la enseñanza de la noción de...
Guía para maestros: Una secuencia didáctica para la enseñanza de la noción de...Guía para maestros: Una secuencia didáctica para la enseñanza de la noción de...
Guía para maestros: Una secuencia didáctica para la enseñanza de la noción de...Compartir Palabra Maestra
 
Ensayo 1 estadistica
Ensayo 1 estadisticaEnsayo 1 estadistica
Ensayo 1 estadisticaCand Jof
 
Proyecto la estadistica en mi escuela
Proyecto la estadistica en mi escuelaProyecto la estadistica en mi escuela
Proyecto la estadistica en mi escuelaElsa Dominini
 
Métodos estadísticos y distribución de frecuencias
Métodos estadísticos y distribución de frecuenciasMétodos estadísticos y distribución de frecuencias
Métodos estadísticos y distribución de frecuenciassantiagozuluaga31
 
3.1 protocolo. taller profundización matemáticas iii
3.1 protocolo. taller profundización matemáticas iii3.1 protocolo. taller profundización matemáticas iii
3.1 protocolo. taller profundización matemáticas iiiYomaraGarciaAlvarez
 

Similar a Pt2 definitivo a1_e2_pelm (20)

2012 revista-educere
2012 revista-educere2012 revista-educere
2012 revista-educere
 
Iii ciclo unidad_de_estadistica_
Iii ciclo unidad_de_estadistica_Iii ciclo unidad_de_estadistica_
Iii ciclo unidad_de_estadistica_
 
III ciclo unidad_de_estadistica
III ciclo unidad_de_estadisticaIII ciclo unidad_de_estadistica
III ciclo unidad_de_estadistica
 
2009 revista-voces
2009 revista-voces2009 revista-voces
2009 revista-voces
 
Actividad 12 cosme_diego
Actividad 12 cosme_diegoActividad 12 cosme_diego
Actividad 12 cosme_diego
 
Actividad 12 cosme_diego
Actividad 12 cosme_diegoActividad 12 cosme_diego
Actividad 12 cosme_diego
 
Estadistica
EstadisticaEstadistica
Estadistica
 
Blog, conceptos de programación, métodos estadísticos (1)
Blog, conceptos de programación, métodos estadísticos (1)Blog, conceptos de programación, métodos estadísticos (1)
Blog, conceptos de programación, métodos estadísticos (1)
 
Blog, conceptos de programación, métodos estadísticos (1)
Blog, conceptos de programación, métodos estadísticos (1)Blog, conceptos de programación, métodos estadísticos (1)
Blog, conceptos de programación, métodos estadísticos (1)
 
Blog, conceptos de programación, métodos estadísticos (1)
Blog, conceptos de programación, métodos estadísticos (1)Blog, conceptos de programación, métodos estadísticos (1)
Blog, conceptos de programación, métodos estadísticos (1)
 
Blog, conceptos de programación, métodos estadísticos (1)
Blog, conceptos de programación, métodos estadísticos (1)Blog, conceptos de programación, métodos estadísticos (1)
Blog, conceptos de programación, métodos estadísticos (1)
 
EDUCACION
EDUCACIONEDUCACION
EDUCACION
 
Trabajo de informatica
Trabajo de informaticaTrabajo de informatica
Trabajo de informatica
 
Guía para maestros: Una secuencia didáctica para la enseñanza de la noción de...
Guía para maestros: Una secuencia didáctica para la enseñanza de la noción de...Guía para maestros: Una secuencia didáctica para la enseñanza de la noción de...
Guía para maestros: Una secuencia didáctica para la enseñanza de la noción de...
 
Ensayo 1 estadistica
Ensayo 1 estadisticaEnsayo 1 estadistica
Ensayo 1 estadistica
 
Ensayo 1 estadistica
Ensayo 1 estadisticaEnsayo 1 estadistica
Ensayo 1 estadistica
 
estadistica_aplicada.pdf
estadistica_aplicada.pdfestadistica_aplicada.pdf
estadistica_aplicada.pdf
 
Proyecto la estadistica en mi escuela
Proyecto la estadistica en mi escuelaProyecto la estadistica en mi escuela
Proyecto la estadistica en mi escuela
 
Métodos estadísticos y distribución de frecuencias
Métodos estadísticos y distribución de frecuenciasMétodos estadísticos y distribución de frecuencias
Métodos estadísticos y distribución de frecuencias
 
3.1 protocolo. taller profundización matemáticas iii
3.1 protocolo. taller profundización matemáticas iii3.1 protocolo. taller profundización matemáticas iii
3.1 protocolo. taller profundización matemáticas iii
 

Más de PEDRO LARA MALDONADO

3.exposicion oral 1.critica-2.tema-algebra-ici_fes-ar
3.exposicion  oral 1.critica-2.tema-algebra-ici_fes-ar3.exposicion  oral 1.critica-2.tema-algebra-ici_fes-ar
3.exposicion oral 1.critica-2.tema-algebra-ici_fes-arPEDRO LARA MALDONADO
 
5.prueba didactica algebra-ici-fes-ar
5.prueba  didactica algebra-ici-fes-ar 5.prueba  didactica algebra-ici-fes-ar
5.prueba didactica algebra-ici-fes-ar PEDRO LARA MALDONADO
 
5.prueba didactica algebra-ici-fes-ar
5.prueba didactica algebra-ici-fes-ar5.prueba didactica algebra-ici-fes-ar
5.prueba didactica algebra-ici-fes-arPEDRO LARA MALDONADO
 
1.critica escrita algebra-ici-fes-ar
1.critica escrita algebra-ici-fes-ar1.critica escrita algebra-ici-fes-ar
1.critica escrita algebra-ici-fes-arPEDRO LARA MALDONADO
 
2.exposicion escrita algebra-ici-fes-ar
2.exposicion escrita algebra-ici-fes-ar2.exposicion escrita algebra-ici-fes-ar
2.exposicion escrita algebra-ici-fes-arPEDRO LARA MALDONADO
 
Unidad 1. determinación del tipo de distribución que presenta un proceso esto...
Unidad 1. determinación del tipo de distribución que presenta un proceso esto...Unidad 1. determinación del tipo de distribución que presenta un proceso esto...
Unidad 1. determinación del tipo de distribución que presenta un proceso esto...PEDRO LARA MALDONADO
 
Unidad 3.conceptos preliminares de teoría de la medida
Unidad 3.conceptos preliminares de teoría de la medidaUnidad 3.conceptos preliminares de teoría de la medida
Unidad 3.conceptos preliminares de teoría de la medidaPEDRO LARA MALDONADO
 
Unidad 2. integral de riemann stieltjes
Unidad 2. integral de riemann stieltjesUnidad 2. integral de riemann stieltjes
Unidad 2. integral de riemann stieltjesPEDRO LARA MALDONADO
 

Más de PEDRO LARA MALDONADO (20)

3.exposicion oral 1.critica-2.tema-algebra-ici_fes-ar
3.exposicion  oral 1.critica-2.tema-algebra-ici_fes-ar3.exposicion  oral 1.critica-2.tema-algebra-ici_fes-ar
3.exposicion oral 1.critica-2.tema-algebra-ici_fes-ar
 
5.prueba didactica algebra-ici-fes-ar
5.prueba  didactica algebra-ici-fes-ar 5.prueba  didactica algebra-ici-fes-ar
5.prueba didactica algebra-ici-fes-ar
 
5.prueba didactica algebra-ici-fes-ar
5.prueba didactica algebra-ici-fes-ar5.prueba didactica algebra-ici-fes-ar
5.prueba didactica algebra-ici-fes-ar
 
1.critica escrita algebra-ici-fes-ar
1.critica escrita algebra-ici-fes-ar1.critica escrita algebra-ici-fes-ar
1.critica escrita algebra-ici-fes-ar
 
2.exposicion escrita algebra-ici-fes-ar
2.exposicion escrita algebra-ici-fes-ar2.exposicion escrita algebra-ici-fes-ar
2.exposicion escrita algebra-ici-fes-ar
 
Pt2 pf pelm (1)
Pt2 pf pelm (1)Pt2 pf pelm (1)
Pt2 pf pelm (1)
 
Pt2 a3 e1_pelm
Pt2 a3 e1_pelmPt2 a3 e1_pelm
Pt2 a3 e1_pelm
 
Pt2 a2 e1_pelm
Pt2 a2 e1_pelmPt2 a2 e1_pelm
Pt2 a2 e1_pelm
 
Pt2 a1 e1_pelm
Pt2 a1 e1_pelmPt2 a1 e1_pelm
Pt2 a1 e1_pelm
 
Ssiems proyecto pelm
Ssiems proyecto pelmSsiems proyecto pelm
Ssiems proyecto pelm
 
Ssiems proyecto pelm
Ssiems proyecto pelmSsiems proyecto pelm
Ssiems proyecto pelm
 
Pt2 definitivo a1_e2_pelm
Pt2 definitivo a1_e2_pelmPt2 definitivo a1_e2_pelm
Pt2 definitivo a1_e2_pelm
 
Ssiems proyecto pelm
Ssiems proyecto pelmSsiems proyecto pelm
Ssiems proyecto pelm
 
Unidad 1. determinación del tipo de distribución que presenta un proceso esto...
Unidad 1. determinación del tipo de distribución que presenta un proceso esto...Unidad 1. determinación del tipo de distribución que presenta un proceso esto...
Unidad 1. determinación del tipo de distribución que presenta un proceso esto...
 
Unidad 4. integral de lebesgue
Unidad 4. integral de lebesgueUnidad 4. integral de lebesgue
Unidad 4. integral de lebesgue
 
Unidad 3.conceptos preliminares de teoría de la medida
Unidad 3.conceptos preliminares de teoría de la medidaUnidad 3.conceptos preliminares de teoría de la medida
Unidad 3.conceptos preliminares de teoría de la medida
 
Unidad 2. integral de riemann stieltjes
Unidad 2. integral de riemann stieltjesUnidad 2. integral de riemann stieltjes
Unidad 2. integral de riemann stieltjes
 
U1.aproximacion
U1.aproximacionU1.aproximacion
U1.aproximacion
 
Mias u2 a2_pelm
Mias u2 a2_pelmMias u2 a2_pelm
Mias u2 a2_pelm
 
Documento para el_facilitador_u2
Documento para el_facilitador_u2Documento para el_facilitador_u2
Documento para el_facilitador_u2
 

Último

Investigacion cualitativa y cuantitativa....pdf
Investigacion cualitativa y cuantitativa....pdfInvestigacion cualitativa y cuantitativa....pdf
Investigacion cualitativa y cuantitativa....pdfalexanderleonyonange
 
llllllllllllllllllllllllllllllllllllllllllllllllllllllllll
llllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllll
llllllllllllllllllllllllllllllllllllllllllllllllllllllllllJulietaCarbajalOsis
 
Cesar Vilchis Vieyra Cesar Vilchis Vieyra
Cesar Vilchis Vieyra  Cesar Vilchis VieyraCesar Vilchis Vieyra  Cesar Vilchis Vieyra
Cesar Vilchis Vieyra Cesar Vilchis Vieyraestudiantes2010
 
CALENDARIZACIÓN ACTUALIZADA DEL 2024 alt.pdf
CALENDARIZACIÓN ACTUALIZADA DEL 2024 alt.pdfCALENDARIZACIÓN ACTUALIZADA DEL 2024 alt.pdf
CALENDARIZACIÓN ACTUALIZADA DEL 2024 alt.pdfPOULANDERSONDELGADOA2
 
Familias_más_ricas_de_AL_en_la_historia.pdf
Familias_más_ricas_de_AL_en_la_historia.pdfFamilias_más_ricas_de_AL_en_la_historia.pdf
Familias_más_ricas_de_AL_en_la_historia.pdfJC Díaz Herrera
 
Los más ricos administradores de fondo de cobertura (1968-2024).pdf
Los más ricos administradores de fondo de cobertura (1968-2024).pdfLos más ricos administradores de fondo de cobertura (1968-2024).pdf
Los más ricos administradores de fondo de cobertura (1968-2024).pdfJC Díaz Herrera
 
COMUNICADO PARA TODO TIPO DE REUNIONES .
COMUNICADO PARA TODO TIPO DE REUNIONES .COMUNICADO PARA TODO TIPO DE REUNIONES .
COMUNICADO PARA TODO TIPO DE REUNIONES .GIANELAKAINACHALLCOJ2
 
Posiciones de México en el PNB PPA per cápita (1982-2024).pdf
Posiciones de México en el PNB PPA per cápita (1982-2024).pdfPosiciones de México en el PNB PPA per cápita (1982-2024).pdf
Posiciones de México en el PNB PPA per cápita (1982-2024).pdfJC Díaz Herrera
 
MÍNIMO COMÚN MÚLTIPLO, MÁXIMO COMÚN DIVISOR.pptx
MÍNIMO COMÚN MÚLTIPLO, MÁXIMO COMÚN DIVISOR.pptxMÍNIMO COMÚN MÚLTIPLO, MÁXIMO COMÚN DIVISOR.pptx
MÍNIMO COMÚN MÚLTIPLO, MÁXIMO COMÚN DIVISOR.pptxCristianCastro978067
 
PANTEÓN DE Paris en historia de la arquitectura
PANTEÓN DE Paris en historia de la arquitecturaPANTEÓN DE Paris en historia de la arquitectura
PANTEÓN DE Paris en historia de la arquitecturaRosaHurtado26
 
Posiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdf
Posiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdfPosiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdf
Posiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdfJC Díaz Herrera
 
Gestión Logística maria palmira guti cabajal
Gestión Logística maria palmira guti cabajalGestión Logística maria palmira guti cabajal
Gestión Logística maria palmira guti cabajalMarcosAlvarezSalinas
 
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdf
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdfIndustria musical de EUA vs Industria musical Corea del Sur (2024).pdf
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdfJC Díaz Herrera
 
Evolución de la fortuna de la familia Slim (1994-2024).pdf
Evolución de la fortuna de la familia Slim (1994-2024).pdfEvolución de la fortuna de la familia Slim (1994-2024).pdf
Evolución de la fortuna de la familia Slim (1994-2024).pdfJC Díaz Herrera
 
Los primeros 60 países por IDH en el año (2024).pdf
Los primeros 60 países por IDH en el año (2024).pdfLos primeros 60 países por IDH en el año (2024).pdf
Los primeros 60 países por IDH en el año (2024).pdfJC Díaz Herrera
 
presentacion de conjuntos para primaria.ppt
presentacion de conjuntos para primaria.pptpresentacion de conjuntos para primaria.ppt
presentacion de conjuntos para primaria.pptMelina Alama Visitacion
 
CNEB-CURRICULO NACIONAL DE EDUCACION BASICA
CNEB-CURRICULO NACIONAL DE EDUCACION BASICACNEB-CURRICULO NACIONAL DE EDUCACION BASICA
CNEB-CURRICULO NACIONAL DE EDUCACION BASICAYOSHELINSARAIMAMANIS2
 
Los idiomas más hablados en el mundo (2024).pdf
Los idiomas más hablados en el mundo  (2024).pdfLos idiomas más hablados en el mundo  (2024).pdf
Los idiomas más hablados en el mundo (2024).pdfJC Díaz Herrera
 
Posiciones en el IDH global de EUA (1950-2024).pdf
Posiciones en el IDH global de EUA (1950-2024).pdfPosiciones en el IDH global de EUA (1950-2024).pdf
Posiciones en el IDH global de EUA (1950-2024).pdfJC Díaz Herrera
 
Las marcas automotrices con más ventas de vehículos (2024).pdf
Las marcas automotrices con más ventas de vehículos (2024).pdfLas marcas automotrices con más ventas de vehículos (2024).pdf
Las marcas automotrices con más ventas de vehículos (2024).pdfJC Díaz Herrera
 

Último (20)

Investigacion cualitativa y cuantitativa....pdf
Investigacion cualitativa y cuantitativa....pdfInvestigacion cualitativa y cuantitativa....pdf
Investigacion cualitativa y cuantitativa....pdf
 
llllllllllllllllllllllllllllllllllllllllllllllllllllllllll
llllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllll
llllllllllllllllllllllllllllllllllllllllllllllllllllllllll
 
Cesar Vilchis Vieyra Cesar Vilchis Vieyra
Cesar Vilchis Vieyra  Cesar Vilchis VieyraCesar Vilchis Vieyra  Cesar Vilchis Vieyra
Cesar Vilchis Vieyra Cesar Vilchis Vieyra
 
CALENDARIZACIÓN ACTUALIZADA DEL 2024 alt.pdf
CALENDARIZACIÓN ACTUALIZADA DEL 2024 alt.pdfCALENDARIZACIÓN ACTUALIZADA DEL 2024 alt.pdf
CALENDARIZACIÓN ACTUALIZADA DEL 2024 alt.pdf
 
Familias_más_ricas_de_AL_en_la_historia.pdf
Familias_más_ricas_de_AL_en_la_historia.pdfFamilias_más_ricas_de_AL_en_la_historia.pdf
Familias_más_ricas_de_AL_en_la_historia.pdf
 
Los más ricos administradores de fondo de cobertura (1968-2024).pdf
Los más ricos administradores de fondo de cobertura (1968-2024).pdfLos más ricos administradores de fondo de cobertura (1968-2024).pdf
Los más ricos administradores de fondo de cobertura (1968-2024).pdf
 
COMUNICADO PARA TODO TIPO DE REUNIONES .
COMUNICADO PARA TODO TIPO DE REUNIONES .COMUNICADO PARA TODO TIPO DE REUNIONES .
COMUNICADO PARA TODO TIPO DE REUNIONES .
 
Posiciones de México en el PNB PPA per cápita (1982-2024).pdf
Posiciones de México en el PNB PPA per cápita (1982-2024).pdfPosiciones de México en el PNB PPA per cápita (1982-2024).pdf
Posiciones de México en el PNB PPA per cápita (1982-2024).pdf
 
MÍNIMO COMÚN MÚLTIPLO, MÁXIMO COMÚN DIVISOR.pptx
MÍNIMO COMÚN MÚLTIPLO, MÁXIMO COMÚN DIVISOR.pptxMÍNIMO COMÚN MÚLTIPLO, MÁXIMO COMÚN DIVISOR.pptx
MÍNIMO COMÚN MÚLTIPLO, MÁXIMO COMÚN DIVISOR.pptx
 
PANTEÓN DE Paris en historia de la arquitectura
PANTEÓN DE Paris en historia de la arquitecturaPANTEÓN DE Paris en historia de la arquitectura
PANTEÓN DE Paris en historia de la arquitectura
 
Posiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdf
Posiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdfPosiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdf
Posiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdf
 
Gestión Logística maria palmira guti cabajal
Gestión Logística maria palmira guti cabajalGestión Logística maria palmira guti cabajal
Gestión Logística maria palmira guti cabajal
 
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdf
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdfIndustria musical de EUA vs Industria musical Corea del Sur (2024).pdf
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdf
 
Evolución de la fortuna de la familia Slim (1994-2024).pdf
Evolución de la fortuna de la familia Slim (1994-2024).pdfEvolución de la fortuna de la familia Slim (1994-2024).pdf
Evolución de la fortuna de la familia Slim (1994-2024).pdf
 
Los primeros 60 países por IDH en el año (2024).pdf
Los primeros 60 países por IDH en el año (2024).pdfLos primeros 60 países por IDH en el año (2024).pdf
Los primeros 60 países por IDH en el año (2024).pdf
 
presentacion de conjuntos para primaria.ppt
presentacion de conjuntos para primaria.pptpresentacion de conjuntos para primaria.ppt
presentacion de conjuntos para primaria.ppt
 
CNEB-CURRICULO NACIONAL DE EDUCACION BASICA
CNEB-CURRICULO NACIONAL DE EDUCACION BASICACNEB-CURRICULO NACIONAL DE EDUCACION BASICA
CNEB-CURRICULO NACIONAL DE EDUCACION BASICA
 
Los idiomas más hablados en el mundo (2024).pdf
Los idiomas más hablados en el mundo  (2024).pdfLos idiomas más hablados en el mundo  (2024).pdf
Los idiomas más hablados en el mundo (2024).pdf
 
Posiciones en el IDH global de EUA (1950-2024).pdf
Posiciones en el IDH global de EUA (1950-2024).pdfPosiciones en el IDH global de EUA (1950-2024).pdf
Posiciones en el IDH global de EUA (1950-2024).pdf
 
Las marcas automotrices con más ventas de vehículos (2024).pdf
Las marcas automotrices con más ventas de vehículos (2024).pdfLas marcas automotrices con más ventas de vehículos (2024).pdf
Las marcas automotrices con más ventas de vehículos (2024).pdf
 

Pt2 definitivo a1_e2_pelm

  • 1. 1 UNIVERSIDAD ABIERTA Y A DISTANCIA DE MÉXICO DIVISIÓN DE CIENCIAS EXACTAS, INGENIERÍA Y TECNOLOGÍA “Análisis Estadístico y Probabilístico de la Deserción Escolar del IEMSDF mediante el Método de Regresión por Mínimos Cuadrados.” PRESENTACION DEL PROYECTO TERMINAL PARA OBTENER EL TÍTULO DE: LICENCIATURA EN MATEMÁTICAS PRESENTA EL ALUMNO SUSTENTANTE: C. PEDRO DANIEL LARA MALDONADO DIRIGIDA POR: MAT. BEATRIZ CARRASCO TORRES EVALUADA POR: DRA. MARLEN HERNÁNDEZ ORTIZ. ELABORADO EN LA: CIUDAD DE MÉXICO, DISTRITO FEDERAL, 2015-2016.
  • 2. 2 1. Resumen El tema de este proyecto se circunscribe a los datos registrados en el Sistema de Información Mexicana del Distrito Federal (INFOMEXDF) dentro de la dependencia paraestatal del Instituto de Educación Media Superior del Distrito Federal por parte de la Dirección Estudiantil; a través del conducto de la Subdirección de Administración Escolar. El objetivo de este proyecto es hacer predicciones de la deserción estudiantil en las últimas generaciones que comprenden del año 2013 hasta el año 2014, considerado para toda la dependencia; se aplicaron los modelos de ajuste de funciones polinomiales mediante el método regresión por mínimos cuadrados para encontrar una función polinomial de ajuste a los datos. Este ajuste se centró en el cálculo del error que define su desviación estándar con distribución 𝑡 −student para poder construir un intervalo de predicción que representa una estimación muestral de estudiantes desertores para las generaciones venideras; cuyos límites de cada intervalo predicho, generó incremento en el indicador del porcentaje de deserción; interpretándolo a corto plazo, permitió plantear una aproximación probable a la magnitud del fenómeno de abandono estudiantil, que propuso a las autoridades competentes del IEMSDF en promover a sus estudiantes, una estimulación de pertenencia trascendental al desarrollo profesional. Palabras claves: Deserción estudiantil, Análisis estadístico y Ajuste matemático. 2. Introducción La deserción escolar en esta dependencia paraestatal del IEMS-DF es un grave problema para el desarrollo sustentable de la población, particularmente en la entidad federativa de la Ciudad de México (Díaz, 2015). Tal situación implica una conducta de riesgo entre sus habitantes, como la consecuencia de gastos presupuestales y pérdidas económicas a nivel local respecto a las oportunidades de trabajo; esto afecta a nivel familiar, en los ingresos salariales que sustenta una mejor calidad de vida individual (Gujarati, 2012). Por lo tanto, en la actualidad el uso de las Herramientas Matemáticas Probabilísticas ha permitido optimizar y determinar los Procesos de los Indicadores de Desempeño en cuestión de considerar la información a través de los datos registrados en un plantel determinado por esta dependencia paraestatal sobre la situación de la Deserción Estudiantil del Sistema Escolarizado cuya causa de este objetivo depende de la relación de la Cuantificación de su Ingreso y Egreso por Generación que se analiza a través del “Modelo Estadístico del Ajuste de Funciones mediante el Método de Regresión por Mínimos Cuadrados” ;cuyo creador fue el matemático alemán Karl Friedrich Gauss en 1795 (Pérez, 2002), el cual permite interpretar geométricamente sus variaciones, en efectuar y determinar la predicción certera del cálculo de la probabilidad como variable de respuesta del pronóstico porcentual de la deserción estudiantil que ocurra en base a la tendencia que ha seguido los datos registrados de estos eventos a lo largo del tiempo y asimismo. Cuyo fin se considere a la situación problemática
  • 3. 3 de este análisis estadístico cuantitativo como argumento para que las autoridades competentes puedan fundamentarlo como un primer paso para tomar medidas preventivas de atención y reflexión de la importancia en corto y a largo plazo de cómo puede afectar a esta dependencia paraestatal y buscarle una decisión alternativa a través de la instrumentación del diseño de estrategias de acciones que pretendan involucrarlos en conocer esta información de la situación de este fenómeno, para que así con base a esas predicciones realizadas adviertan mejores decisiones que faciliten la viabilidad de reducir su incidencia desertora para que sea orientada como una propuesta al fomento del incremento del egreso estudiantil que conlleva a la dimensión del bienestar en su permanencia en el plantel. 3. Marco Teórico 3.1. Deserción Estudiantil La deserción estudiantil es un indicador situacional de abandono del sistema escolar, provocado por la combinación de factores que se generan en el entorno como en contextos interpersonales (Lara, 2016). El evento de desertar puede ocurrir en cualquier momento durante el período por generación: por ejemplo, si un individuo deserta en la mitad del semestre que esté estudiando y otro lo hace finalizando el semestre que estudió, la duración en la institución es diferente. Sin embargo, en la base de datos que permitirá estimar los parámetros del modelo, la duración será igual para dichos individuos (tres semestres), tomando así únicamente valores discretos generacionales (1, 2, 3, ..., etc.). Entonces, la relación del flujo escolar de una generación desertora, se define por medio de la siguiente fórmula: 𝐏𝐃𝐆 = ( 𝐄𝐈𝐆 − 𝐄𝐄𝐆 𝐄𝐈𝐆 ) ∗ 𝟏𝟎𝟎(Ponce, 2003) … (𝟏) Donde: 𝐏𝐃𝐆 = Porcentaje de deserción generacional 𝐄𝐄𝐆 = Número de estudiantes que egresarón por generación 𝐄𝐈𝐆 = Número de estudiantes que ingresarón por generación El propósito de la ecuación … (𝟏) es dar información útil y verídica, que explica cuantitativamente el fenómeno de la deserción estudiantil en el instituto y esto contribuirá en desarrollar un óptimo modelo matemático para el pronóstico cuantitativo, que determina el comportamiento futuro de este indicador analítico, para diseñar estrategias de prevención y atención a la población estudiantil que cursa este nivel educativo en la dependencia. 3.2 Análisis estadístico Es importante considerar a la Estadística como una herramienta de apoyo que puede dar respuesta a muchas de las necesidades que la actual sociedad plantea, a razón de que su tarea fundamental es la reducción de datos, con el objetivo de representar la realidad y describirla,
  • 4. 4 predecir su futuro o simplemente conocerla; en nuestros días se ha convertido en una rama de la matemática efectiva para describir con exactitud los valores de datos físicos, políticos y sociales que sirve para relacionar y analizar dichos datos. Esto implica que esta herramienta no consiste sólo en resumir y tabular los datos, sino en enfocarse en el proceso de interpretación de esta información (Levin, 2004). Es importante considerar que Pronosticar o dar aproximaciones a futuros eventos ha sido una práctica frecuente para los seres humanos. En tiempos remotos estos pronósticos se realizaban mediante métodos un poco ortodoxos. Con el paso del tiempo y gracias a los avances teóricos y tecnológicos de la ciencia, estas aproximaciones han ido cambiando hasta llegar a metodologías rigurosamente científicas y bien fundamentadas teóricamente (Cannavos, 1988). Con esto decimos que el desarrollo de la Teoría de la Probabilidad ha aumentado el alcance de las aplicaciones de la estadística a razón de que muchos de los conjuntos de datos se pueden aproximar, con gran exactitud, utilizando modelos probabilísticos; por lo tanto, los resultados de estas pueden utilizarse para analizar datos estadísticos. Así, la Probabilidad es útil para comprobar la fiabilidad de las inferencias estadísticas y para predecir el tipo y la cantidad de datos necesarios en un determinado estudio estadístico (Figueroa, 2014). Entonces el análisis del Método de Regresión es una técnica estadística para investigar y modelar la relación entre variables, de tal manera que son numerosas las aplicaciones de esto en cualquier campo; incluyendo ciencias físicas, experimentales y sociales; y de hecho se puede decir que esta técnica estadística es la más usada. Por lo tanto, este análisis sustenta la fundamentación de los métodos numéricos que se basan en los modelos matemáticos para desarrollarlo y efectuarlo mediante un ajuste polinomial (Hines, 1996). 3.3. Ajuste Matemático 3.3.1 Fundamentos sobre el Ajuste de Funciones polinomiales El ajuste de funciones polinomiales es una técnica para el modelado de datos mediante una ecuación (Bittinger, 2002), y es importante considerar la siguiente pregunta: ¿Cómo decidir qué tipo de función polinomial si existe, podría ajustarse a los datos? Una forma simple consiste en examinar un Diagrama de Dispersión que es una gráfica de datos de dos variables en la variable independiente está en el eje horizontal y la variable dependiente en el eje vertical, entonces con esto se hace el énfasis en definir qué Tipos de Variables se van a considerar en este modelo: ● Variable Dependiente: Es la variable que se predice o se explica. Se representa por 𝑦. ● Variable Independiente: Es la variable que sirve para predecir o explicar. Se representa por 𝑥.
  • 5. 5 Luego, es importante buscar un patrón que se parezca a una de las gráficas de los tipos de funciones polinomiales que hay. A continuación, se presenta un Procedimiento que se considera y que la mayoría de las veces funciona para determinar modelos matemáticos: 1. Representar gráficamente los datos (en la forma de Diagrama de Dispersión). 2. Observar el diagrama de dispersión para determinar si parece ajustarse a una función conocida. 3. Determinar una función que ajuste los datos. Ahora con esto se va a utilizar el grupo de funciones polinomiales para observar cuál función, si existe, podría ajustarse a ciertos datos: ● Los datos podrían modelarse mediante una función polinomial lineal si la gráfica parece una línea recta. ● Los datos podrían modelarse mediante una función polinomial cuadrática, si la gráfica sube y luego baja, o baja y luego sube, en una forma encorvada que se parezca a una parábola. ● Si los datos caen, luego aumentan, y vuelven a caer (de modo que no se ajustan a una función polinomial lineal o una función polinomial cuadrática), pero podrían ajustarse a una función polinomial cúbica. 3.3.2. Definición del Método de Regresión por Mínimos Cuadrados Es una técnica de análisis numérico enmarcada dentro de la optimización matemática, en la que, dados un conjunto de pares ordenados que incluyen una variable independiente y una variable dependiente. La cual busca encontrar la función continua, que mejor se aproxime a los datos (un "mejor ajuste"), de acuerdo con el criterio de mínimo error cuadrático. Más aun, esto coincide con el principio de máxima probabilidad de la estadística (Valdés, 2014). Entonces decimos que, desde un punto de vista estadístico, un requisito implícito para que funcione el método de mínimos cuadrados es que los errores de cada medida estén distribuidos de forma aleatoria para determinar el mejor ajuste de una función polinomial a través de la consideración de utilizar como mínimo cuatro puntos (Gerald, 2000). 3.3.3. Procedimiento del Método de Regresión por Mínimos Cuadrados Se supone que se conocen datos que consta de 𝑛 puntos que se definen como: ( 𝑥1, 𝑦1), ( 𝑥2, 𝑦2), …, ( 𝑥 𝑛, 𝑦 𝑛) y que el objetivo es hallar una función polinomial 𝑦 = 𝑓(𝑥) que se ajuste razonablemente a los datos, por lo que el primer paso es decidir qué tipo de función probar a través de la inspección gráfica de los 𝑛 puntos, como se muestra en la 𝐅𝐢𝐠𝐮𝐫𝐚 𝟏.
  • 6. 6 𝐅𝐢𝐠𝐮𝐫𝐚 𝟏. Representación gráfica de los diferentes tipos de ajuste para encontrar una función polinomial (Chapra, 2011). Es importante evitar incertidumbres en la elección de la función de ajuste. Por lo tanto, se considera una óptima decisión, a través del mínimo valor en su coeficiente de determinación 𝑅2 define su procedimiento a efectuar en este análisis, el cual representa el comportamiento general de los datos como se muestra en la ecuación … (𝟐) (Carrillo, 2008). 𝑹 𝟐 = ∑ 𝒌=𝟏 𝒏 [ 𝒚 𝒌 − 𝒇( 𝒙 𝒏)] 𝟐 … (𝟐) 3.3.4. Clasificación de Modelos en las Funciones Polinomiales para el Método de Regresión por Mínimos Cuadrados. El caso más usado en la práctica es poder ajustar funciones polinomiales, ya que en este caso los parámetros serán funciones de cualquier tipo que son fáciles de estimar (Marín, 2014). El modelo a ajustar estará basado en su generalización del ajuste polinomial de grado 𝑚 que está dado por: 𝒇(𝒙; 𝒂 𝟏, 𝒂 𝟐, … , 𝒂 𝒎) = 𝒂 𝟎 + 𝒂 𝟏 𝒙 + 𝒂 𝟐 𝒙 𝟐 + ⋯ + 𝒂 𝒎 𝒙 𝒎 … (𝟑) Por medio de esta consideración en la ecuación … (𝟑) se aproxima ahora a un conjunto de datos {( 𝑥𝑖, 𝑦𝑖)}𝑖=1 𝑚 con una función polinomial algebraica de grado 𝑛 < 𝑚 − 1 mediante el procedimiento de mínimos cuadrados (Mathews, 2000); por lo que se ha definido el polinomio como: 𝒇 𝒏(𝒙𝒊) = 𝒂 𝟎 + 𝒂 𝟏 𝒙𝒊 + ⋯ + 𝒂 𝒏−𝟏 𝒙𝒊 𝒏−𝟏 + 𝒂 𝒏 𝒙𝒊 𝒏 = ∑𝒋=𝟎 𝒏 𝒂𝒋 𝒙𝒊 𝒋 … (𝟒) Para obtener el error más bajo en mínimos cuadrados, es necesario seleccionar de la ecuación … (𝟒) las constantes 𝑎0, 𝑎1, … , 𝑎 𝑛 de tal manera que las derivadas parciales con respecto a cada una de ellas sean cero y así para cada 𝑗: 𝑹 𝟐 = ∑𝒊=𝟏 𝒎 [𝒚𝒊 − 𝒇(𝒙𝒊)] 𝟐 = ∑𝒊=𝟏 𝒎 𝒚𝒊 𝟐 − 𝟐∑𝒋=𝟎 𝒏 𝒂𝒋(∑𝒊=𝟏 𝒎 𝒚𝒊 𝒙𝒊 𝒋 ) + ∑𝒋=𝟎 𝒏 ∑ 𝒌=𝟎 𝒏 𝒂𝒋 𝒂 𝒌(∑𝒊=𝟏 𝒎 𝒙𝒊 𝒋+𝒌 ) … (𝟓) 𝝏𝑹 𝟐 𝝏𝒂𝒋 = −𝟐∑𝒊=𝟏 𝒎 𝒚𝒊 𝒙𝒊 𝒋 + 𝟐∑ 𝒌=𝟎 𝒎 𝒂 𝒌∑𝒊=𝟏 𝒎 𝒙𝒊 𝒋+𝒌 … (𝟔)
  • 7. 7 Esto da 𝑛 + 1 ecuaciones normales con 𝑛 + 1 incógnitas 𝑎𝑗, por lo tanto, ∑ 𝒌=𝟎 𝒏 𝒂 𝒌∑𝒊=𝟏 𝒎 𝒙𝒊 𝒋+𝒌 = ∑𝒊=𝟏 𝒎 𝒚𝒊 𝒙𝒊 𝒋 … (𝟕) Para cada 𝑗 = 0,1, … , 𝑛 se tiene: 𝒂 𝟎(∑𝒊=𝟏 𝒎 𝒙𝒊 𝟎 ) + 𝒂 𝟏(∑𝒊=𝟏 𝒎 𝒙𝒊 𝟏 ) + 𝒂 𝟐(∑𝒊=𝟏 𝒎 𝒙𝒊 𝟐 ) + ⋯ + 𝒂 𝒏(∑𝒊=𝟏 𝒎 𝒙𝒊 𝒏 ) = ∑𝒊=𝟏 𝒎 𝒚𝒊 𝒙𝒊 𝟎 𝒂 𝟎(∑𝒊=𝟏 𝒎 𝒙𝒊) + 𝒂 𝟏(∑𝒊=𝟏 𝒎 𝒙𝒊 𝟐 ) + 𝒂 𝟐(∑𝒊=𝟏 𝒎 𝒙𝒊 𝟑 ) + ⋯ + 𝒂 𝒏(∑𝒊=𝟏 𝒎 𝒙𝒊 𝒏+𝟏 ) = ∑𝒊=𝟏 𝒎 𝒚𝒊 𝒙𝒊 𝟏 ⋮ 𝒂 𝟎(∑𝒊=𝟏 𝒎 𝒙𝒊 𝒏 ) + 𝒂 𝟏(∑𝒊=𝟏 𝒎 𝒙𝒊 𝒏+𝟏 ) + 𝒂 𝟐(∑𝒊=𝟏 𝒎 𝒙𝒊 𝒏+𝟐 ) + ⋯ + 𝒂 𝒏(∑𝒊=𝟏 𝒎 𝒙𝒊 𝟐𝒏 ) = ∑𝒊=𝟏 𝒎 𝒚𝒊 𝒙𝒊 𝒏 … (𝟖) Por lo tanto, estas ecuaciones normales … (𝟖) tienen solución única siempre y cuando las 𝑥𝑖 sean distintas y en tal caso, la función apropiada de mínimos cuadrados (probablemente un polinomio de grado 𝑛) puede deducirse con los valores de la función que se reemplace con los datos cuando la medida de bondad de ajuste de 𝑅2 sea suficientemente pequeña, a esto se le denomina “suavizamiento de datos” y su aplicación de esto es encontrar los parámetros: 𝑎1, 𝑎2, … , 𝑎 𝑛 a través de la resolución de sistemas de ecuaciones normales (Spiegel, 1970). Entonces se supone ajustar una pareja de datos a través de este modelo de la función polinomial generalizada en cuestión de la suma de los errores al cuadrado 𝑅2 que está dada por: 𝑹 𝟐 = ∑ 𝒌=𝟏 𝑵 [𝒚 𝒌 − (𝒂 𝟎 + 𝒂 𝟏 𝒙 + 𝒂 𝟐 𝒙 𝟐 + ⋯ + 𝒂 𝒎 𝒙 𝒎)] 𝟐 … (𝟗) Para encontrar el valor de los parámetros 𝑎0, 𝑎1, … , 𝑎 𝑚 de … (𝟗) se procede a relacionar el cambio de variables de los subíndices 𝑛 con 𝑚 que se definen en las sumatorias de … (𝟖); por lo tanto, se obtiene el sistema de ecuaciones normales para el grado 𝑚 que está dada por: 𝒂 𝟎 𝑵 + 𝒂 𝟏(∑𝒊=𝟏 𝑵 𝒙𝒊) + ⋯ + 𝒂 𝒎(∑𝒊=𝟏 𝑵 𝒙𝒊 𝒎 ) = ∑𝒊=𝟏 𝑵 𝒚𝒊 𝒂 𝟎(∑𝒊=𝟏 𝑵 𝒙𝒊) + 𝒂 𝟏(∑𝒊=𝟏 𝑵 𝒙𝒊 𝟐 ) + ⋯ + 𝒂 𝒎(∑𝒊=𝟏 𝑵 𝒙𝒊 𝒎+𝟏 ) = ∑𝒊=𝟏 𝑵 𝒙𝒊 𝒚𝒊 ⋮ 𝒂 𝟎(∑𝒊=𝟏 𝑵 𝒙𝒊 𝒎 ) + 𝒂 𝟏(∑𝒊=𝟏 𝑵 𝒙𝒊 𝒎+𝟏 ) + ⋯ + 𝒂 𝒎(∑𝒊=𝟏 𝑵 𝒙𝒊 𝟐𝒎 ) = ∑𝒊=𝟏 𝑵 𝒙𝒊 𝒎 𝒚𝒊 … (𝟏𝟎) Sin embargo, para hallar la función de mejor ajuste, se determinan los valores o coeficientes respectivamente en cada caso de los tipos de funciones para 𝑎0, 𝑎1, … , 𝑎 𝑚 donde 𝑚 ≥ 0. Por lo tanto, se considera el sistema de ecuaciones normales del ajuste polinomial de grado 𝒎 … (𝟗) en términos matriciales de la forma 𝑿𝒂̂ = 𝒀, es decir: [ 𝑵 ∑𝒊=𝟏 𝑵 𝒙𝒊 ⋮ ∑𝒊=𝟏 𝑵 𝒙𝒊 𝒎 ∑𝒊=𝟏 𝑵 𝒙𝒊 ∑𝒊=𝟏 𝑵 𝒙𝒊 𝟐 ⋮ ∑𝒊=𝟏 𝑵 𝒙𝒊 𝒎+𝟏 ⋯ ⋯ ⋱ ⋯ ∑𝒊=𝟏 𝑵 𝒙𝒊 𝒎 ∑𝒊=𝟏 𝑵 𝒙𝒊 𝒎+𝟏 ⋮ ∑𝒊=𝟏 𝑵 𝒙𝒊 𝟐𝒎 ] [ 𝒂 𝟎 𝒂 𝟏 ⋮ 𝒂 𝒎 ] = [ ∑𝒊=𝟏 𝑵 𝒚𝒊 ∑𝒊=𝟏 𝑵 𝒙𝒊 𝒚𝒊 ⋮ ∑𝒊=𝟏 𝑵 𝒙𝒊 𝒎 𝒚𝒊] … (𝟏𝟏)
  • 8. 8 Para encontrar la solución matricial se tiene que multiplicar la ecuación matricial 𝑿𝒂̂ = 𝒀 y después se calcula su inversa (se multiplicó por la matriz transpuesta para que quede una matriz cuadrada) 𝑿 𝑻 𝑿𝒂̂ = 𝑿 𝑻 𝒀 →∴ 𝒂̂ = ( 𝑿 𝑻 𝑿) −𝟏 𝑿 𝑻 𝒀 … (𝟏𝟐) Este sistema de ecuaciones lineales simultáneas se puede resolver fácilmente usando la famosa regla de Cramer (para polinomios lineales y cuadráticos) y el método de eliminación Gaussiana (para polinomios al menos de tercer grado). Los coeficientes de la matriz de … (𝟏𝟏) se encuentran acomodando los datos en la Tabla 1. 𝐓𝐚𝐛𝐥𝐚 𝟏. 𝐀𝐣𝐮𝐬𝐭𝐞 𝐩𝐨𝐥𝐢𝐧𝐨𝐦𝐢𝐚𝐥 𝐝𝐞 𝐠𝐫𝐚𝐝𝐨 𝒎. 𝒊 𝒙𝒊 𝒙𝒊 𝟐 𝒙𝒊 𝟑 ⋯ 𝒙𝒊 𝟐𝒎 𝒚𝒊 𝒙𝒊 𝒚𝒊 𝒙𝒊 𝟐 𝒚𝒊 ⋯ 𝒙𝒊 𝒎 𝒚𝒊 1 𝑥1 𝑥1 2 𝑥1 3 ⋯ 𝑥1 2𝑚 𝑦1 𝑥1 𝑦1 𝑥1 2 𝑦1 ⋯ 𝑥1 𝑚 𝑦1 2 𝑥2 𝑥2 2 𝑥2 3 ⋯ 𝑥2 2𝑚 𝑦2 𝑥2 𝑦2 𝑥2 2 𝑦2 ⋯ 𝑥2 𝑚 𝑦2 3 𝑥3 𝑥3 2 𝑥3 3 ⋯ 𝑥3 2𝑚 𝑦3 𝑥3 𝑦3 𝑥3 2 𝑦3 ⋯ 𝑥3 𝑚 𝑦3 ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ 𝑁 𝑥 𝑁 𝑥 𝑁 2 𝑥 𝑁 3 ⋯ 𝑥 𝑁 2𝑚 𝑦 𝑁 𝑥 𝑁 𝑦 𝑁 𝑥 𝑁 2 𝑦 𝑁 ⋯ 𝑥 𝑁 𝑚 𝑦 𝑁 ∑𝑖=1 𝑁 𝑥𝑖 ∑𝑖=1 𝑁 𝑥𝑖 2 ∑𝑖=1 𝑁 𝑥𝑖 3 ⋯ ∑𝑖=1 𝑁 𝑥𝑖 2𝑚 ∑𝑖=1 𝑁 𝑦𝑖 ∑𝑖=1 𝑁 𝑥𝑖 𝑦𝑖 ∑𝑖=1 𝑁 𝑥𝑖 2 𝑦𝑖 ⋯ ∑𝑖=1 𝑁 𝑥𝑖 𝑚 𝑦𝑖 3.3.4.1. Ajuste de la función polinomial lineal 𝒚 = 𝒂 𝟎 + 𝒂 𝟏 𝒙 Se recuerda que una aproximación por mínimos cuadrados consiste en ajustar a una línea recta un conjunto de datos discretos de la forma: ( 𝑥1, 𝑦1), ( 𝑥2, 𝑦2), …, ( 𝑥 𝑁, 𝑦 𝑁) Por lo tanto, se inicia en considerar una ecuación de una línea recta a la cual se relaciona al comportamiento de los datos y el modelo propuesto, de esta forma se tiene: 𝑦 = 𝑎0 + 𝑎1 𝑥 dónde 𝑎0 =es la ordenada al origen y 𝑎1 =es la pendiente. Al aplicar el criterio de que el “mejor” ajuste se cumple cuando se puede minimizar la suma de los cuadrados de los residuos 𝑹 𝟐 , es decir, el error entre el modelo y los datos experimentales, se tiene que: 𝑹 𝟐 = ∑𝒊=𝟏 𝒏 ( 𝒚 𝟏 − 𝒂 𝟎 − 𝒂 𝟏 𝒙𝒊) 𝟐 … (𝟏𝟑) Este criterio tiene la ventaja de proporcionar una línea única para un conjunto de datos. Para determinar los valores de 𝑎0 y 𝑎1 que minimizan la ecuación se deriva la ecuación con respecto a cada uno de los coeficientes
  • 9. 9 𝝏𝑹 𝟐 𝝏𝒂 𝟎 = −𝟐∑(𝒚𝒊 − 𝒂 𝟎 − 𝒂 𝟏 𝒙𝒊) = 𝟎 𝝏𝑹 𝟐 𝝏𝒂 𝟏 = −𝟐∑[(𝒚 𝟏 − 𝒂 𝟎 − 𝒂 𝟏 𝒙𝒊)𝒙𝒊] = 𝟎 … (𝟏𝟒) Al igualar ambas derivadas en las ecuaciones … (𝟏𝟒) a cero, se genera un mínimo para la suma de los cuadrados de los residuos 𝑹 𝟐 de la siguiente forma: −𝟐∑(𝒚𝒊 − 𝒂 𝟎 − 𝒂 𝟏 𝒙𝒊) = 𝟎 = ∑𝒚𝒊 − ∑𝒂 𝟎 − ∑𝒂 𝟏 𝒙𝒊 … (𝟏𝟓) −𝟐∑[(𝒚 𝟏 − 𝒂 𝟎 − 𝒂 𝟏 𝒙𝒊)𝒙𝒊] = 𝟎 = ∑𝒚𝒊 𝒙𝒊 − ∑𝒂 𝟎 𝒙𝒊 − ∑𝒂 𝟏 𝒙𝒊 𝟐 … (𝟏𝟔) De la ecuación … (𝟏𝟒) se obtiene ∑𝒚𝒊 = 𝒏𝒂 𝟎 + 𝒂 𝟏∑𝒙𝒊 … (𝟏𝟕) De la ecuación … (𝟏𝟓) se obtiene ∑𝒚𝒊 𝒙𝒊 = 𝒂 𝟎∑𝒙𝒊 + 𝒂 𝟏∑(𝒙𝒊) 𝟐 … . (𝟏𝟖) Al resolver en forma simultánea las ecuaciones … (𝟏𝟕) y … (𝟏𝟖) se obtienen los valores de 𝑎0 y 𝑎1 mediante las siguientes ecuaciones: 𝒂 𝟏 = 𝒏 ∑ 𝒙𝒊 𝒚𝒊 − ∑ 𝒙𝒊 𝒚 𝟏 𝒏 ∑ 𝒙𝒊 𝟐 − (∑ 𝒙𝒊) 𝟐 … (𝟏𝟗), 𝒂 𝒐 = ∑ 𝒚𝒊 𝒏 − 𝒂 𝟏 ( ∑ 𝒙𝒊 𝒏 ) … (𝟐𝟎) Por lo tanto, construyendo la Tabla 2; para el caso lineal. 𝐓𝐚𝐛𝐥𝐚 𝟐. 𝐀𝐣𝐮𝐬𝐭𝐞 𝐩𝐨𝐥𝐢𝐧𝐨𝐦𝐢𝐚𝐥 𝐥𝐢𝐧𝐞𝐚𝐥 𝒊 𝒙𝒊 𝒙𝒊 𝟐 𝒚𝒊 𝒙𝒊 𝒚𝒊 1 𝑥1 𝑥1 2 𝑦1 𝑥1 𝑦1 2 𝑥2 𝑥2 2 𝑥2 𝑥2 𝑦2 3 𝑥3 𝑥3 2 𝑦3 𝑥3 𝑦3 ⋮ ⋮ ⋮ ⋮ ⋮ 𝑁 𝑥 𝑁 𝑥 𝑁 2 𝑦 𝑁 𝑥 𝑁 𝑦 𝑁 Suma por columna ∑𝒊=𝟏 𝑵 𝒙𝒊 ∑𝒊=𝟏 𝑵 𝒙𝒊 𝟐 ∑𝒊=𝟏 𝑵 𝒚𝒊 ∑𝒊=𝟏 𝑵 𝒙𝒊 𝒚𝒊 Las ecuaciones normales matriciales para el caso del ajuste lineal están dadas por: [ 𝑵 ∑𝒊=𝟏 𝑵 𝒙𝒊 ∑𝒊=𝟏 𝑵 𝒙𝒊 ∑𝒊=𝟏 𝑵 𝒙𝒊 𝟐] [ 𝒂 𝟎 𝒂 𝟏 ] = [ ∑𝒊=𝟏 𝑵 𝒚𝒊 ∑𝒊=𝟏 𝑵 𝒙𝒊 𝒚𝒊 ] … (𝟐𝟏) Este sistema de ecuaciones … (𝟐𝟏) se puede resolver con los métodos habituales (suma y resta, Cramer, sustitución, etc.).
  • 10. 10 3.3.4.2. Ajuste de la función polinomial cuadrático 𝒚 = 𝒂 𝟎 + 𝒂 𝟏 𝒙 + 𝒂 𝟐 𝒙 𝟐 De la misma manera considerando la Tabla 3; para una ajuste cuadrático o parabólico. 𝐓𝐚𝐛𝐥𝐚 𝟑. 𝐀𝐣𝐮𝐬𝐭𝐞 𝐩𝐨𝐥𝐢𝐧𝐨𝐦𝐢𝐚𝐥 𝐜𝐮𝐚𝐝𝐫á𝐭𝐢𝐜𝐨. 𝒊 𝒙𝒊 𝒙𝒊 𝟐 𝒙𝒊 𝟑 𝒙𝒊 𝟒 𝒚𝒊 𝒙𝒊 𝒚𝒊 𝒙𝒊 𝟐 𝒚𝒊 1 𝑥1 𝑥1 2 𝑥1 3 𝑥1 4 𝑦1 𝑥1 𝑦1 𝑥1 2 𝑦1 2 𝑥2 𝑥2 2 𝑥2 3 𝑥2 4 𝑥2 𝑥2 𝑦2 𝑥2 2 𝑦2 3 𝑥3 𝑥3 2 𝑥3 3 𝑥3 4 𝑦3 𝑥3 𝑦3 𝑥3 2 𝑦3 ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ 𝑁 𝑥 𝑁 𝑥 𝑁 2 𝑥 𝑁 3 𝑥 𝑁 4 𝑦 𝑁 𝑥 𝑁 𝑦 𝑁 𝑥 𝑁 2 𝑦 𝑁 Suma por columna ∑𝒊=𝟏 𝑵 𝒙𝒊 ∑𝒊=𝟏 𝑵 𝒙𝒊 𝟐 ∑𝒊=𝟏 𝑵 𝒙𝒊 𝟑 ∑𝒊=𝟏 𝑵 𝒙𝒊 𝟒 ∑𝒊=𝟏 𝑵 𝒚𝒊 ∑𝒊=𝟏 𝑵 𝒙𝒊 𝒚𝒊 ∑𝒊=𝟏 𝑵 𝒙𝒊 𝟐 𝒚𝒊 Las ecuaciones normales para el caso del ajuste polinomial cuadrático están dadas por: [ 𝑵 ∑𝒊=𝟏 𝑵 𝒙𝒊 ∑𝒊=𝟏 𝑵 𝒙𝒊 𝟐 ∑𝒊=𝟏 𝑵 𝒙𝒊 ∑𝒊=𝟏 𝑵 𝒙𝒊 𝟐 ∑𝒊=𝟏 𝑵 𝒙𝒊 𝟑 ∑𝒊=𝟏 𝑵 𝒙𝒊 𝟐 ∑𝒊=𝟏 𝑵 𝒙𝒊 𝟑 ∑𝒊=𝟏 𝑵 𝒙𝒊 𝟒 ] [ 𝒂 𝟎 𝒂 𝟏 𝒂 𝟐 ] = [ ∑𝒊=𝟏 𝑵 𝒚𝒊 ∑𝒊=𝟏 𝑵 𝒙𝒊 𝒚𝒊 ∑𝒊=𝟏 𝑵 𝒙𝒊 𝟐 𝒚𝒊 ] … (𝟐𝟐) Este sistema de ecuaciones … (𝟐𝟐) se puede resolver con los métodos de Cramer de 3 variables con 3 incógnitas. 3.3.4.3. Ajuste de la función polinomial cúbico: 𝒚 = 𝒂 𝟎 + 𝒂 𝟏 𝒙 +𝒂 𝟐 𝒙 𝟐 + 𝒂 𝟑 𝒙 𝟑 Similarmente, considerando la Tabla 4; para el caso cúbico. 𝐓𝐚𝐛𝐥𝐚 𝟒. 𝐀𝐣𝐮𝐬𝐭𝐞 𝐩𝐨𝐥𝐢𝐧𝐨𝐦𝐢𝐚𝐥 𝐜ú𝐛𝐢𝐜𝐨 𝒊 𝒙𝒊 𝒙𝒊 𝟐 𝒙𝒊 𝟑 𝒙𝒊 𝟒 𝒙𝒊 𝟓 𝒙𝒊 𝟔 𝒚𝒊 𝒙𝒊 𝒚𝒊 𝒙𝒊 𝟐 𝒚𝒊 𝒙𝒊 𝟑 𝒚𝒊 1 𝑥1 𝑥1 2 𝑥1 3 𝑥1 4 𝑥1 5 𝑥1 6 𝑦1 𝑥1 𝑦1 𝑥1 2 𝑦1 𝑥1 3 𝑦1 2 𝑥2 𝑥2 2 𝑥2 3 𝑥2 4 𝑥2 5 𝑥2 6 𝑥2 𝑥2 𝑦2 𝑥2 2 𝑦2 𝑥2 3 𝑦2 3 𝑥3 𝑥3 2 𝑥3 3 𝑥3 4 𝑥3 5 𝑥3 6 𝑦3 𝑥3 𝑦3 𝑥3 2 𝑦3 𝑥3 3 𝑦3 ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ 𝑁 𝑥 𝑁 𝑥 𝑁 2 𝑥 𝑁 3 𝑥 𝑁 4 𝑥 𝑁 5 𝑥 𝑁 6 𝑦 𝑁 𝑥 𝑁 𝑦 𝑁 𝑥 𝑁 2 𝑦 𝑁 𝑥 𝑁 3 𝑦 𝑁 Suma por columna ∑𝒊=𝟏 𝑵 𝒙𝒊 ∑𝒊=𝟏 𝑵 𝒙𝒊 𝟐 ∑𝒊=𝟏 𝑵 𝒙𝒊 𝟑 ∑𝒊=𝟏 𝑵 𝒙𝒊 𝟒 ∑𝒊=𝟏 𝑵 𝒙𝒊 𝟓 ∑𝒊=𝟏 𝑵 𝒙𝒊 𝟔 ∑𝒊=𝟏 𝑵 𝒚𝒊 ∑𝒊=𝟏 𝑵 𝒙𝒊 𝒚𝒊 ∑𝒊=𝟏 𝑵 𝒙𝒊 𝟐 𝒚𝒊 ∑𝒊=𝟏 𝑵 𝒙𝒊 𝟑 𝒚𝒊 Las ecuaciones normales matriciales para el caso del ajuste cúbico están dadas por el siguiente sistema de 4 variables y 4 ecuaciones:
  • 11. 11 [ 𝑵 ∑𝒊=𝟏 𝑵 𝒙𝒊 ∑𝒊=𝟏 𝑵 𝒙𝒊 𝟐 ∑𝒊=𝟏 𝑵 𝒙𝒊 𝟑 ∑𝒊=𝟏 𝑵 𝒙𝒊 ∑𝒊=𝟏 𝑵 𝒙𝒊 𝟐 ∑𝒊=𝟏 𝑵 𝒙𝒊 𝟑 ∑𝒊=𝟏 𝑵 𝒙𝒊 𝟒 ∑𝒊=𝟏 𝑵 𝒙𝒊 𝟐 ∑𝒊=𝟏 𝑵 𝒙𝒊 𝟑 ∑𝒊=𝟏 𝑵 𝒙𝒊 𝟒 ∑𝒊=𝟏 𝑵 𝒙𝒊 𝟓 ∑𝒊=𝟏 𝑵 𝒙𝒊 𝟑 ∑𝒊=𝟏 𝑵 𝒙𝒊 𝟒 ∑𝒊=𝟏 𝑵 𝒙𝒊 𝟓 ∑𝒊=𝟏 𝑵 𝒙𝒊 𝟔 ] [ 𝒂 𝟎 𝒂 𝟏 𝒂 𝟐 𝒂 𝟑 ] = [ ∑𝒊=𝟏 𝑵 𝒚𝒊 ∑𝒊=𝟏 𝑵 𝒙𝒊 𝒚𝒊 ∑𝒊=𝟏 𝑵 𝒙𝒊 𝟐 𝒚𝒊 ∑𝒊=𝟏 𝑵 𝒙𝒊 𝟑 𝒚𝒊] … (𝟐𝟑) Se sugiere utilizar los casos de la Tabla 2 hasta la Tabla 4 de la generalización de la Tabla 1, a razón de que estos dan un óptimo ajuste para poder encontrar el valor de los parámetros 𝑎 𝑘 con 𝑘 = 1, … , 𝑚 que minimicen esta suma; es decir: 𝐦𝐢𝐧 𝒂 𝟏,…,𝒂 𝒎 𝑹 𝟐 = 𝐦𝐢𝐧 𝒂 𝟏,…,𝒂 𝒎 ∑[𝒚 𝒌 − 𝒇(𝒙 𝒌; 𝒂 𝟏, 𝒂 𝟐, … , 𝒂 𝒎)] 𝟐 … (𝟐𝟒) Para poder encontrar estos coeficientes de la ecuación … (𝟐𝟒) se debe cumplir cada una de las ecuaciones presentadas en los casos de la Tabla 2 hasta la Tabla 4; a través del criterio siguiente: 𝝏(𝑹 𝟐) 𝝏𝒂𝒊 = 𝟎 𝐜𝐨𝐧 𝒊 = 𝟏, … , 𝒎. … (𝟐𝟓) En términos generales es un sistema de ecuaciones no lineales con 𝑚 restricciones (Marín, 2014). 3.3.5. Los residuales que definen al Método de Regresión por Mínimos Cuadrados En el caso práctico no es posible encontrar esta función polinomial 𝑦 = 𝑓(𝑥) y que satisfaga exactamente todas las relaciones: 𝒚 𝟏 = 𝒇(𝒙 𝟏) 𝒚 𝟐 = 𝒇(𝒙 𝟐) ⋮ 𝒚 𝒏 = 𝒇(𝒙 𝒏) … (𝟐𝟔) Por lo general, uno está dispuesto a aceptar un "residual" (que dependerá de cada observación) y se define de la manera siguiente: 𝒇(𝒙 𝒌) = 𝒚 𝒌 + 𝒆 𝒌 … (𝟐𝟕) Donde 𝑒 𝑘 es el residual que define la medición observada en el dato. La pregunta que uno se hace es ¿cómo poder encontrar "la mejor aproximación" que pase por los puntos? (Smith, 1988). Para responder esta pregunta, hay que considerar los residuales (también llamado como las desviaciones) y están dados como la diferencia del valor estimado por el modelo 𝑓( 𝑥 𝑘) menos el valor observado 𝑦 𝑘, es decir: Residuales de Medición 𝒆 𝒌 = 𝒇(𝒙 𝒌) − 𝒚 𝒌 𝐩𝐚𝐫𝐚 𝟏 ≤ 𝒌 ≤ 𝒏 … (𝟐𝟖) 𝐑𝐞𝐬𝐢𝐝𝐮𝐚𝐥 = 𝐕𝐚𝐥𝐨𝐫 𝐄𝐬𝐭𝐢𝐦𝐚𝐝𝐨 − 𝐕𝐚𝐥𝐨𝐫 𝐎𝐛𝐬𝐞𝐫𝐯𝐚𝐝𝐨 … (𝟐𝟗)
  • 12. 12 Esta diferencia también suele denotarse por 𝑒𝑖y con esto se podrá determinar el “residual de estimación” que permite fijar límites dentro de los cuales estará el valor real con cierto grado de confiabilidad entre los datos verdaderos u observados de 𝑦𝑖 y los datos estimados o evaluados de 𝑦𝑖̂ , es decir: 𝒆𝒊 = 𝒚𝒊 − 𝒚𝒊̂ →∴ 𝒆𝒊 = 𝒚𝒊 − 𝒇̂(𝒙𝒊) … (𝟑𝟎) Esta ecuación debe satisfacer la condición de minimizar la suma de las residuales (𝑒𝑖) del comportamiento de cada par de datos discretos (Quintana, 2005), con respecto al modelo propuesto, elevadas al cuadrado, es decir: ∑ 𝒆𝒊 𝟐 = ∑[𝒚𝒊 − 𝒇̂(𝒙𝒊)] 𝟐 𝒏 𝒊=𝟏 = ∑(𝒚𝒊 − 𝒚𝒊̂ ) 𝟐 →∴ ∑(𝒚𝒊,𝒎𝒆𝒅𝒊𝒅𝒂 − 𝒚̂𝒊,𝒎𝒐𝒅𝒆𝒍𝒐) 𝟐 … (𝟑𝟏) En la Figura 2 se representa la ecuación … (𝟐𝟗) 𝐅𝐢𝐠𝐮𝐫𝐚 𝟐. Comparación gráfica de los valores observados y de los valores estimados en el residual de medición (Marín, 2013) Este análisis describe las predicciones generacionales a través del cálculo del residual; que este sea lo más exacto posible, es decir un valor mínimo para encontrar el mejor ajuste para los datos presentados e inferir qué acciones se debe llevar a cabo para cada situación respectiva en la modalidad del estudio a efectuar (Anderson, 2008). La validez de la aplicación del método de mínimos cuadrados para el ajuste de funciones descansa sobre tres suposiciones sobre los residuales que son la: 1.-Independencia: requiere que los residuales sean independientes unos de otros. 2.-Normalidad: requiere que los residuales se distribuyen normalmente en cada valor de la variable independiente. 3.-Homocedasticidad: requiere que la varianza de los residuales sea constante; es decir requiere que tengan igual varianza. Esta validez de la aplicación del método de mínimos cuadrados se define como el criterio de determinación del mejor ajuste polinomial, dado por:
  • 13. 13 𝐦𝐢𝐧 𝐑 𝟐 > 𝐑 𝐚 𝟐 (Infante, 2012) … (𝟑𝟐) 𝐃𝐨𝐧𝐝𝐞: R2 = Coeficiente de determinación Ra 2 = Coeficiente de determinación ajustado La ecuación … (𝟑𝟐) nos precisa que modelo de función polinomial es el óptimo, para que este sea el detonador de poder pronosticar los rangos con certeza. 3.3.6. Intervalos de predicción Considerando el ajuste de la función polinomial, se asume que tienen 𝑁 parejas de números (𝑥1, 𝑦1), (𝑥2, 𝑦2) hasta (𝑥 𝑁, 𝑦 𝑁) y se desea ajustar el mejor polinomio de grado 𝑚 dado por: 𝒚 = 𝒂 𝟎 + 𝒂 𝟏 𝒙 + 𝒂 𝟐 𝒙 𝟐 + ⋯ + 𝒂 𝒎 𝒙 𝒎 … (𝟑𝟑) Por lo tanto, se definen los probables intervalos de predicción al 95% de la deserción estudiantil para esta dependencia del IEMSDF, con su respectiva generación en 𝑥 𝑝, dada por: 𝒚 𝒑 = 𝑿 𝒑 𝒂̂ ± 𝒕 𝟎.𝟗𝟕𝟓 𝑵−(𝒎+𝟏) 𝝈̂√𝟏 + 𝑿 𝒑(𝑿 𝑻 𝑿)−𝟏 𝑿 𝒑 𝑻 (Wackerly, 2010) … (𝟑𝟒) 𝐃𝐨𝐧𝐝𝐞: La variable definida generacional del porcentaje de deserción a predecir = 𝒚 𝒑 La matriz pronóstico para 𝑝 datos generacionales = 𝑿 𝒑 = [ 𝟏 𝒙 𝒑 ⋯ 𝒙 𝒑 𝒎 ] La matriz de parámetros = 𝒂̂ = (𝑿 𝑻 𝑿) −𝟏 𝑿 𝑻 𝒀 = [ 𝒂 𝟎 𝒂 𝟏 ⋮ 𝒂 𝒎 ] El percentil de una 𝑡 Student = 𝒕 𝟎.𝟗𝟕𝟓 𝑵−(𝒎+𝟏) con 𝑵 − (𝒎 + 𝟏) = 𝒗 grados de libertad. 𝐂𝐨𝐧𝐬𝐢𝐝𝐞𝐫𝐚𝐧𝐝𝐨 𝐪𝐮𝐞: 𝒎 = Grado del polinomio que se obtuvo en el ajuste. 𝑿 = [ 𝟏 𝟏 ⋮ 𝟏 𝒙 𝟏 𝒙 𝟐 ⋮ 𝒙 𝑵 ⋯ ⋯ ⋱ ⋯ 𝒙 𝟏 𝒎 𝒙 𝟐 𝒎 ⋮ 𝒙 𝑵 𝒎 ] = La matriz de diseño del ajuste polinomial. 𝒀 = [ 𝒚 𝟏 𝒚 𝟐 ⋮ 𝒚 𝑵 ] = La matriz de respuesta del modelo ajustado a los datos. 𝑿 𝑻 = La matriz transpuesta de diseño del ajuste polinomial. 𝑵 = Número de datos.
  • 14. 14 (𝑿 𝑻 𝑿) −𝟏 = La matriz inversa. El error estándar de estimación = 𝝈̂ = √ 𝑺𝑪𝑬 𝑵 − (𝒎 + 𝟏) = √ 𝒀 𝑻 𝒀 − 𝒂̂ 𝑻 𝑿 𝑻 𝒀 𝑵 − (𝒎 + 𝟏) 𝐃𝐞𝐟𝐢𝐧𝐢𝐞𝐧𝐝𝐨: 𝑺𝑪𝑬 = Suma de cuadrados del error. 𝒀 𝑻 = La matriz transpuesta de respuesta del modelo ajustado a los datos. 𝒂̂ 𝑻 = La matriz transpuesta de los parámetros. Respecto al orden de la bivalencia ± el intervalo de predicción es expresado como: 𝑿 𝒑 𝒂̂ − 𝒕 𝟎.𝟗𝟕𝟓 𝑵−(𝒎+𝟏) 𝝈̂√𝟏 + 𝑿 𝒑(𝑿 𝑻 𝑿)−𝟏 𝑿 𝒑 𝑻 ≤ 𝒚 𝒑 ≤ 𝑿 𝒑 𝒂̂ + 𝒕 𝟎.𝟗𝟕𝟓 𝑵−(𝒎+𝟏) 𝝈̂√𝟏 + 𝑿 𝒑(𝑿 𝑻 𝑿)−𝟏 𝑿 𝒑 𝑻 … (𝟑𝟓) La hipótesis indica que el valor esperado de los residuales sea cero y también que la varianza de los errores sea constante, es decir: 𝑬[𝒆 𝒌] = 𝟎 𝐩𝐚𝐫𝐚 𝒌 = 𝟏, 𝟐, … , 𝒏 𝑽𝒂𝒓[𝒆 𝒌] = 𝝈̂ 𝐩𝐚𝐫𝐚 𝒌 = 𝟏, 𝟐, … , 𝒏 (Infante, 2012) … (𝟑𝟔) 4. Metodología En este proyecto fue necesario recurrir al ordenador, para poder resolver el objetivo planteado; por lo que se utilizaron las siguientes herramientas computacionales: ● La hoja de cálculo de Microsoft Excel 2016 del sistema operativo Windows 10. ● Wólfram Alpha desde: http://www.wolframalpha.com/ ● Matrixcalc versión slu. desde: https://matrixcalc.org/es/slu.html ● Octave-MATLAB desde: http://octave-online.net/ Es de especial importancia considerarlo a razón de que se plantea el modelo óptimo para dar respuesta a las siguientes cuestiones fundamentales: 1). ¿Cuáles son las relaciones en las que estará basado el modelo? El fenómeno de la deserción estudiantil en la dependencia del IEMS-DF se considera por medio de las generaciones escolares, en este caso se tomará la relación del ingreso-egreso de cada generación de todos los planteles de la modalidad escolarizada. 2). ¿Cuál es la formulación del Modelo? A través de los datos registrados del Sistema de Información Mexicana del Distrito Federal (INFOMEXDF), para poder inferir los valores estimados a pronosticar a través del ajuste de funciones polinomiales, se considera la relación numérica de orden cronológico de la generación en los valores discretos, es decir: Si la
  • 15. 15 primera generación del IEMS-DF fue en 2001-2002, se considera por conveniencia al modelo, como generación 1. 3). ¿Qué atributos caracterizan el modelo? Por medio de la fórmula del porcentaje de deserción generacional-PDG, ecuación … (𝟏), para aplicarlo en Excel: 𝐓𝐚𝐛𝐥𝐚 𝟓. 𝐃𝐚𝐭𝐨𝐬 𝐝𝐞 𝐥𝐚 𝐝𝐞𝐩𝐞𝐧𝐝𝐞𝐧𝐜𝐢𝐚 𝐈𝐄𝐌𝐒𝐃𝐅 (𝐒𝐢𝐬𝐭𝐞𝐦𝐚 𝐈𝐍𝐅𝐎𝐌𝐄𝐗𝐃𝐅, 𝟐𝟎𝟏𝟔) 𝐆𝐞𝐧𝐞𝐫𝐚𝐜𝐢ó𝐧 𝐄𝐈𝐆 𝐄𝐄𝐆 𝐏𝐃𝐆 2001 − 𝟏 3062 349 𝟖𝟖. 𝟔𝟎 2002 − 𝟐 3719 644 𝟖𝟐. 𝟔𝟖 2003 − 𝟑 3401 901 𝟕𝟑. 𝟓𝟏 2004 − 𝟒 5647 1390 𝟕𝟓. 𝟑𝟗 2005 − 𝟓 5443 1602 𝟕𝟎. 𝟓𝟕 2006 − 𝟔 5538 1765 𝟔𝟖. 𝟏𝟑 2007 − 𝟕 5762 1735 𝟔𝟗. 𝟖𝟗 2008 − 𝟖 5804 1533 𝟕𝟑. 𝟓𝟗 2009 − 𝟗 5729 1502 𝟕𝟑. 𝟕𝟖 2010 − 𝟏𝟎 6149 1591 𝟕𝟒. 𝟏𝟑 2011 − 𝟏𝟏 6625 1700 𝟕𝟒. 𝟑𝟒 2012 − 𝟏𝟐 6372 1601 𝟕𝟒. 𝟖𝟕 2013 − 𝟏𝟑 6349 ¿ ? ¿ ? 2014 − 𝟏𝟒 6826 ¿ ? ¿ ? 4.) ¿Cuáles son las restricciones a emplear para simplificar el modelo? Cabe aclarar que en el presente trabajo se tomará en cuenta las siguientes variables: ● Variable cuantitativa independiente ( 𝑥): Define la generación del año escolar donde se analiza la deserción de estudiantes en esta dependencia del IEMS-DF. ● Variable cuantitativa dependiente ( 𝑦): Define el porcentaje de la deserción generacional estudiantil de esta dependencia del IEMS-DF. Esto implica relacionar y definir las siguientes parejas ordenadas: (𝐱 𝟏, 𝐲 𝟏 ) = (𝐠𝐞𝐧𝐞𝐫𝐚𝐜𝐢ó𝐧 𝟏, 𝐏𝐃𝐆 𝟏) ⋮ (𝐱 𝐧, 𝐲 𝐧) = (𝐠𝐞𝐧𝐞𝐫𝐚𝐜𝐢ó𝐧 𝐧, 𝐏𝐃𝐆 𝐧) … (𝟑𝟕) Dónde la ecuación … (𝟑𝟕) se delimita, como los valores discretos por conveniencia a la respectiva generación 𝑛 = 1,2, … ,12; que estos se relacionan, como: (𝐱 𝟏, 𝐲 𝟏 ) = (𝟏, 𝐏𝐃𝐆 𝟏) ⋮ (𝐱 𝟏𝟐, 𝐲 𝟏𝟐) = (𝟏𝟐, 𝐏𝐃𝐆 𝟏𝟐) … (𝟑𝟖)
  • 16. 16 Luego, se toma la consideración de la ecuación … (𝟑𝟖), para poder realizar el siguiente arreglo, que va a definir el ajuste: 𝐓𝐚𝐛𝐥𝐚 𝟔. 𝐑𝐞𝐥𝐚𝐜𝐢ó𝐧 𝐝𝐞 𝐯𝐚𝐫𝐢𝐚𝐛𝐥𝐞𝐬 𝐟𝐮𝐧𝐝𝐚𝐦𝐞𝐧𝐭𝐚𝐥𝐞𝐬 𝐩𝐚𝐫𝐚 𝐞𝐥 𝐚𝐣𝐮𝐬𝐭𝐞 𝐩𝐨𝐥𝐢𝐧𝐨𝐦𝐢𝐚𝐥 𝐜𝐮𝐚𝐝𝐫á𝐭𝐢𝐜𝐨. 𝒙𝒊 𝒚𝒊 𝟏 88.60 𝟐 82.68 𝟑 73.51 𝟒 75.39 𝟓 70.57 𝟔 68.13 𝟕 69.89 𝟖 73.59 𝟗 73.78 𝟏𝟎 74.13 𝟏𝟏 74.34 𝟏𝟐 74.87 𝐒𝐢𝐞𝐧𝐝𝐨: 𝒙𝒊 = 𝐑𝐞𝐩𝐫𝐞𝐬𝐞𝐧𝐭𝐚𝐜𝐢ó𝐧 𝐝𝐞 𝐥𝐚 𝐠𝐞𝐧𝐞𝐫𝐚𝐜𝐢ó𝐧 𝐞𝐬𝐜𝐨𝐥𝐚𝐫 𝐞𝐧 𝐥𝐨𝐬 𝐯𝐚𝐥𝐨𝐫𝐞𝐬 𝐝𝐢𝐬𝐜𝐫𝐞𝐭𝐨𝐬 𝒚𝒊 = 𝐏𝐨𝐫𝐜𝐞𝐧𝐭𝐚𝐣𝐞 𝐝𝐞 𝐝𝐞𝐬𝐞𝐫𝐜𝐢ó𝐧 𝐠𝐞𝐧𝐞𝐫𝐚𝐜𝐢𝐨𝐧𝐚𝐥 (𝐏𝐃𝐆) = ( 𝐄𝐈𝐆 − 𝐄𝐄𝐆 𝐄𝐈𝐆 ) ∗ 𝟏𝟎𝟎 5.) ¿Cuál es el criterio del mejor ajuste a los datos en el modelo? Para poder realizar el óptimo ajuste polinomial a los datos de la Tabla 6, se corrobora mediante el software wólfram alpha: http://www.wolframalpha.com/ de la siguiente manera: fit {{1,86.60}, {2,82.68}, {3,73.51}, {4,75.39}, {5,70.57}, {6,68.13}, {7,69.89}, {8,73.59}, {9,73.78}, {10,74.13}, {11,74.34}, {12,74.87}} Esta sintaxis a ejecutar, dará las mejores opciones de ajuste polinomiales a los datos que en este caso, su diagnóstico, es: 𝐅𝐢𝐠𝐮𝐫𝐚 𝟑. El diagnóstico de los ajustes viables a los datos en 𝑤ó𝑙𝑓𝑟𝑎𝑚 𝑎𝑙𝑝ℎ𝑎.
  • 17. 17 Para encontrar el óptimo ajuste polinomial a los datos, del diagnóstico de la Figura 3, se emplea el criterio de determinación del mejor ajuste de la ecuación … (𝟑𝟐), para poder encontrar la función que definirá los intervalos de predicción de la ecuación … (𝟑𝟓); por lo tanto, en este caso, resulta: 𝐦𝐢𝐧 𝐑 𝟐 > 𝐑 𝐚 𝟐 → 0.793787 > 0.747962 →∴ 𝐅𝐮𝐧𝐜𝐢ó𝐧 𝐂𝐮𝐚𝐝𝐫á𝐭𝐢𝐜𝐚 … (𝟑𝟗) Con la determinación de la ecuación … (𝟑𝟗) se va a proceder a realizar manualmente la Tabla 3 del ajuste polinomial cuadrático correspondiente para poder aplicar la relación de variables en el método de los mínimos cuadrados de la siguiente manera: 𝐓𝐚𝐛𝐥𝐚 𝟕. 𝐀𝐣𝐮𝐬𝐭𝐞 𝐩𝐨𝐥𝐢𝐧𝐨𝐦𝐢𝐚𝐥 𝐝𝐞 𝐥𝐚 𝐝𝐞𝐩𝐞𝐧𝐝𝐞𝐧𝐜𝐢𝐚 𝐈𝐄𝐌𝐒𝐃𝐅 𝒊 𝒙𝒊 𝒙𝒊 𝟐 𝒙𝒊 𝟑 𝒙𝒊 𝟒 𝒚𝒊 𝒙𝒊 𝒚𝒊 𝒙𝒊 𝟐 𝒚𝒊 1 1 1 1 1 88.60 88.60 88.60 2 2 4 8 16 82.68 165.36 330.72 3 3 9 27 81 73.51 220.53 661.59 4 4 16 64 256 75.39 301.56 1206.24 5 5 25 125 625 70.57 352.85 1764.25 6 6 36 216 1296 68.13 408.78 2452.68 7 7 49 343 2401 69.89 489.23 3424.61 8 8 64 512 4096 73.59 588.72 4709.76 9 9 81 729 6561 73.78 664.02 5976.18 10 10 100 1000 10000 74.13 741.30 7413.00 11 11 121 1331 14641 74.34 817.74 8995.14 12 12 144 1728 20736 74.87 898.44 10781.28 Suma por columna 𝟕𝟖 ∑𝒊=𝟏 𝟏𝟐 𝒙𝒊 𝟔𝟓𝟎 ∑𝒊=𝟏 𝟏𝟐 𝒙𝒊 𝟐 𝟔𝟎𝟖𝟒 ∑𝒊=𝟏 𝟏𝟐 𝒙𝒊 𝟑 𝟔𝟎𝟕𝟏𝟎 ∑𝒊=𝟏 𝟏𝟐 𝒙𝒊 𝟒 𝟖𝟗𝟗. 𝟒𝟖 ∑𝒊=𝟏 𝟏𝟐 𝒚𝒊 𝟓𝟕𝟑𝟕. 𝟏𝟑 ∑𝒊=𝟏 𝟏𝟐 𝒙𝒊 𝒚𝒊 𝟒𝟕𝟖𝟎𝟒. 𝟎𝟓 ∑𝒊=𝟏 𝟏𝟐 𝒙𝒊 𝟐 𝒚𝒊 Entonces, las ecuaciones normales para el caso del ajuste polinomial cuadrático están dadas por la ecuación … (𝟐𝟐): [ 𝟏𝟐 ∑𝒊=𝟏 𝟏𝟐 𝒙𝒊 ∑𝒊=𝟏 𝟏𝟐 𝒙𝒊 𝟐 ∑𝒊=𝟏 𝟏𝟐 𝒙𝒊 ∑𝒊=𝟏 𝟏𝟐 𝒙𝒊 𝟐 ∑𝒊=𝟏 𝟏𝟐 𝒙𝒊 𝟑 ∑𝒊=𝟏 𝟏𝟐 𝒙𝒊 𝟐 ∑𝒊=𝟏 𝟏𝟐 𝒙𝒊 𝟑 ∑𝒊=𝟏 𝟏𝟐 𝒙𝒊 𝟒 ] [ 𝒂 𝟎 𝒂 𝟏 𝒂 𝟐 ] = [ ∑𝒊=𝟏 𝟏𝟐 𝒚𝒊 ∑𝒊=𝟏 𝟏𝟐 𝒙𝒊 𝒚𝒊 ∑𝒊=𝟏 𝟏𝟐 𝒙𝒊 𝟐 𝒚𝒊] … (𝟒𝟎) Para resolver el sistema de ecuaciones … (𝟒𝟎) de este ajuste polinomial cuadrático, se emplea el software Matrixcalc: https://matrixcalc.org/es/slu.html cuya indicación a ejecutar es el Método de la matriz inversa en relación a la forma de la ecuación … (𝟐𝟐), por lo que en este caso se define, como:
  • 18. 18 𝑨 ∙ 𝒂̂ = 𝑩 →∴ 𝒂̂ = 𝑨−𝟏 ∙ 𝑩 → [ 𝒂 𝟎 𝒂 𝟏 𝒂 𝟐 ] = [ 𝑵 ∑𝒊=𝟏 𝑵 𝒙𝒊 ∑𝒊=𝟏 𝑵 𝒙𝒊 𝟐 ∑𝒊=𝟏 𝑵 𝒙𝒊 ∑𝒊=𝟏 𝑵 𝒙𝒊 𝟐 ∑𝒊=𝟏 𝑵 𝒙𝒊 𝟑 ∑𝒊=𝟏 𝑵 𝒙𝒊 𝟐 ∑𝒊=𝟏 𝑵 𝒙𝒊 𝟑 ∑𝒊=𝟏 𝑵 𝒙𝒊 𝟒 ] −𝟏 [ ∑𝒊=𝟏 𝑵 𝒚𝒊 ∑𝒊=𝟏 𝑵 𝒙𝒊 𝒚𝒊 ∑𝒊=𝟏 𝑵 𝒙𝒊 𝟐 𝒚𝒊 ] … (𝟒𝟏) 5. Resultados En este caso la forma matricial de la ecuación … (𝟒𝟎) se define como los valores de las sumatorias encontradas en la Tabla 7 y esto se sustituye respectivamente de la siguiente manera: [ 𝟏𝟐 𝟕𝟖 𝟔𝟓𝟎 𝟕𝟖 𝟔𝟓𝟎 𝟔𝟎𝟖𝟒 𝟔𝟓𝟎 𝟔𝟎𝟖𝟒 𝟔𝟎𝟕𝟏𝟎 ] [ 𝒂 𝟎 𝒂 𝟏 𝒂 𝟐 ] = [ 𝟖𝟗𝟗. 𝟒𝟖 𝟓𝟕𝟑𝟕. 𝟏𝟑 𝟒𝟕𝟖𝟎𝟒. 𝟎𝟓 ] … (𝟒𝟐) Realizando la multiplicación matricial en el lado izquierdo de la ecuación … (𝟒𝟐) nos conduce a resolver un sistema de ecuaciones, para encontrar los coeficientes respectivos de este ajuste polinomial cuadrático: 𝟏𝟐𝒂 𝟎 + 𝟕𝟖𝒂 𝟎 + 𝟔𝟓𝟎𝒂 𝟎 + 𝟕𝟖 𝒂 𝟏 + 𝟔𝟓𝟎𝒂 𝟏 + 𝟔𝟎𝟖𝟒𝒂 𝟏 + 𝟔𝟓𝟎𝒂 𝟐 = 𝟔𝟎𝟖𝟒𝒂 𝟐 = 𝟔𝟎𝟕𝟏𝟎𝒂 𝟐 = 𝟖𝟗𝟗. 𝟒𝟖 𝟓𝟕𝟑𝟕. 𝟏𝟑 𝟒𝟕𝟖𝟎𝟒. 𝟎𝟓 … (𝟒𝟑) Entonces, considerando los valores matriciales de la ecuación … (𝟒𝟐), como: 𝑨 = [ 𝟏𝟐 𝟕𝟖 𝟔𝟓𝟎 𝟕𝟖 𝟔𝟓𝟎 𝟔𝟎𝟖𝟒 𝟔𝟓𝟎 𝟔𝟎𝟖𝟒 𝟔𝟎𝟕𝟏𝟎 ] ; 𝑩 = [ 𝟖𝟗𝟗. 𝟒𝟖 𝟓𝟕𝟑𝟕. 𝟏𝟑 𝟒𝟕𝟖𝟎𝟒. 𝟎𝟓 ] … (𝟒𝟒) Luego se calcula la inversa de 𝐴 en el software Matrixcalc: 𝑨−𝟏 = [ 𝟒𝟕 𝟒𝟒 − 𝟏𝟓 𝟒𝟒 𝟏 𝟒𝟒 − 𝟏𝟓 𝟒𝟒 𝟓𝟑𝟓 𝟒𝟎𝟎𝟒 − 𝟑 𝟑𝟎𝟖 𝟏 𝟒𝟒 − 𝟑 𝟑𝟎𝟖 𝟑 𝟒𝟎𝟎𝟒 ] … (𝟒𝟓) Por lo tanto, se procede a encontrar los coeficientes del ajuste cuadrático en el software Matrixcalc:
  • 19. 19 𝒂̂ = 𝑨−𝟏 ∙ 𝑩 → [ 𝒂 𝟎 𝒂 𝟏 𝒂 𝟐 ] = [ 𝟒𝟕 𝟒𝟒 − 𝟏𝟓 𝟒𝟒 𝟏 𝟒𝟒 − 𝟏𝟓 𝟒𝟒 𝟓𝟑𝟓 𝟒𝟎𝟎𝟒 − 𝟑 𝟑𝟎𝟖 𝟏 𝟒𝟒 − 𝟑 𝟑𝟎𝟖 𝟑 𝟒𝟎𝟎𝟒 ] ∙ [ 𝟖𝟗𝟗. 𝟒𝟖 𝟓𝟕𝟑𝟕. 𝟏𝟑 𝟒𝟕𝟖𝟎𝟒. 𝟎𝟓 ] = [ 𝟐𝟎𝟏𝟏𝟑𝟑 𝟐𝟐𝟎𝟎 − 𝟖𝟏𝟑𝟕 𝟏𝟒𝟑𝟎 𝟓𝟒𝟏𝟕 𝟏𝟒𝟑𝟎𝟎 ] … (𝟒𝟔) En la ecuación … (𝟒𝟔) se encuentra la solución, para los coeficientes del ajuste polinomial cuadrático, que está dado por: 𝒂 𝟎 = 𝟗𝟏. 𝟒𝟐𝟒𝟎𝟗, 𝒂 𝟏 = −𝟓. 𝟔𝟗𝟎𝟐𝟏, 𝒂 𝟐 = 𝟎. 𝟑𝟕𝟖𝟖𝟏 … (𝟒𝟕) Por lo tanto, se relaciona los coeficientes encontrados en … (𝟒𝟕) para sustituirlos en el mejor modelo de ajuste polinomial cuadrático: 𝒚̂ = 𝒂 𝟎 + 𝒂 𝟏 𝒙 + 𝒂 𝟐 𝒙 𝟐 →∴ 𝒚̂ = 𝟗𝟏. 𝟒𝟐𝟒𝟎𝟗 − 𝟓. 𝟔𝟗𝟎𝟐𝟏𝒙 + 𝟎. 𝟑𝟕𝟖𝟖𝟏𝒙 𝟐 … (𝟒𝟖) Esta ecuación … (𝟒𝟖) implica encontrar los probables intervalos de predicción al 95% de confianza sobre el porcentaje de la deserción estudiantil para esta dependencia, que está dado por la ecuación … (𝟑𝟒): 𝒚 𝒑 = 𝑿 𝒑 𝒂̂ ± 𝒕 𝟎.𝟗𝟕𝟓 𝟏𝟐−(𝟐+𝟏) 𝝈̂√𝟏 + 𝑿 𝒑(𝑿 𝑻 𝑿)−𝟏 𝑿 𝒑 𝑻 … (𝟒𝟗) Después en la ecuación … (𝟒𝟗) se realiza operaciones correspondientes en el lado derecho de la bivalencia ± : 𝒚 𝒑 = 𝑿 𝒑 𝒂̂ ± 𝒕 𝟎.𝟗𝟕𝟓 𝟗 (√ 𝒀 𝑻 𝒀 − 𝒂̂ 𝑻 𝑿 𝑻 𝒀 𝟏𝟐 − (𝟐 + 𝟏) ) √𝟏 + 𝑿 𝒑(𝑿 𝑻 𝑿)−𝟏 𝑿 𝒑 𝑻 … (𝟓𝟎) Esto implica, encontrar el percentil de la distribución 𝑡 Student, que en este caso se define como: 𝒕 𝟎.𝟗𝟕𝟓 𝟗 , por lo que este valor, se corrobora mediante el software wólfram alpha: http://www.wolframalpha.com/ de la siguiente manera: 97.5 Percentile Student´s t distribution degrees of freedom 9 Esta sintaxis a ejecutar, da el valor correspondiente de 𝒕 𝟎.𝟗𝟕𝟓 𝟗 = 𝟐. 𝟐𝟔𝟐𝟏𝟔 … (𝟓𝟏) Luego, se procede a calcular el error de la estimación: 𝝈̂ = √ 𝒀 𝑻 𝒀 − 𝒂̂ 𝑻 𝑿 𝑻 𝒀 𝟗 … (𝟓𝟐)
  • 20. 20 Para obtener la suma de cuadrados del error (𝑺𝑪𝑬), se define, para este caso de ajuste polinomial cuadrático, los elementos matriciales del numerador de la ecuación … (𝟓𝟐), por lo tanto se emplea el software Matrixcalc: https://matrixcalc.org/es/slu.html de la siguiente forma: 𝑿 = [ 𝟏 𝟏 ⋮ 𝟏 𝒙 𝟏 𝒙 𝟐 ⋮ 𝒙 𝟏𝟐 𝒙 𝟏 𝟐 𝒙 𝟐 𝟐 ⋮ 𝒙 𝟏𝟐 𝟐 ] = [ 𝟏 𝟏 𝟏 𝟏 𝟏 𝟏 𝟏 𝟏 𝟏 𝟏 𝟏 𝟏 𝟏 𝟐 𝟑 𝟒 𝟓 𝟔 𝟕 𝟖 𝟗 𝟏𝟎 𝟏𝟏 𝟏𝟐 𝟏 𝟒 𝟗 𝟏𝟔 𝟐𝟓 𝟑𝟔 𝟒𝟗 𝟔𝟒 𝟖𝟏 𝟏𝟎𝟎 𝟏𝟐𝟏 𝟏𝟒𝟒] →∴ 𝑿 𝑻 = [ 𝟏 𝟏 𝟏 𝟏 𝟐 𝟒 𝟏 𝟑 𝟗 𝟏 𝟒 𝟏𝟔 𝟏 𝟓 𝟐𝟓 𝟏 𝟔 𝟑𝟔 𝟏 𝟕 𝟒𝟗 𝟏 𝟖 𝟔𝟒 𝟏 𝟗 𝟖𝟏 𝟏 𝟏𝟎 𝟏𝟎𝟎 𝟏 𝟏𝟏 𝟏𝟐𝟏 𝟏 𝟏𝟐 𝟏𝟒𝟒 ] 𝒀 = [ 𝒚 𝟏 𝒚 𝟐 ⋮ 𝒚 𝟏𝟐 ] = [ 𝟖𝟖. 𝟔𝟎 𝟖𝟐. 𝟔𝟖 𝟕𝟑. 𝟓𝟏 𝟕𝟓. 𝟑𝟗 𝟕𝟎. 𝟓𝟕 𝟔𝟖. 𝟏𝟑 𝟔𝟗. 𝟖𝟗 𝟕𝟑. 𝟓𝟗 𝟕𝟑. 𝟕𝟖 𝟕𝟒. 𝟏𝟑 𝟕𝟒. 𝟑𝟒 𝟕𝟒. 𝟖𝟕] →∴ 𝒀 𝑻 = [ 𝟖𝟖. 𝟔𝟎 𝟖𝟐. 𝟔𝟖 𝟕𝟑. 𝟓𝟏 𝟕𝟓. 𝟑𝟗 𝟕𝟎. 𝟓𝟕 𝟔𝟖. 𝟏𝟑 𝟔𝟗. 𝟖𝟗 𝟕𝟑. 𝟓𝟗 𝟕𝟑. 𝟕𝟖 𝟕𝟒. 𝟏𝟑 𝟕𝟒. 𝟑𝟒 𝟕𝟒. 𝟖𝟕] 𝒂̂ = [ 𝒂 𝟎 𝒂 𝟏 𝒂 𝟐 ] = [ 𝟗𝟏. 𝟒𝟐𝟒𝟎𝟗 −𝟓. 𝟔𝟗𝟎𝟐𝟏 𝟎. 𝟑𝟕𝟖𝟖𝟏 ] →∴ 𝒂̂ 𝑻 = [ 𝟗𝟏. 𝟒𝟐𝟒𝟎𝟗 −𝟓. 𝟔𝟗𝟎𝟐𝟏 𝟎. 𝟑𝟕𝟖𝟖𝟏] … (𝟓𝟑) Esto implica, sustituir los elementos matriciales de la ecuación … (𝟓𝟑), para poder efectuar la operación matricial del numerador de la ecuación … (𝟓𝟐) con el software Matrixcalc: https://matrixcalc.org/es/slu.html de la siguiente manera: 𝒀 𝑻 𝒀 = 𝟔𝟕𝟕𝟔𝟓. 𝟗 𝒂̂ 𝑻 𝑿 𝑻 𝒀 = 𝟔𝟕𝟔𝟗𝟕. 𝟑 → 𝝈̂ = √ 𝟔𝟕𝟕𝟔𝟓. 𝟗 − 𝟔𝟕𝟔𝟗𝟕. 𝟑 𝟗 𝜎̂ = √ 68.6 9 →∴ 𝜎̂ = √7.62222 𝝈̂ = 𝟐. 𝟕𝟔𝟎 … (𝟓𝟒) Por lo tanto, se sustituye los valores de las ecuaciones … (𝟓𝟏) y … (𝟓𝟒) en el intervalo de predicción de la ecuación … (𝟓𝟎): 𝒚 𝒑 = 𝑿 𝒑 𝒂̂ ± ( 𝟐. 𝟐𝟔𝟐𝟏𝟔)( 𝟐. 𝟕𝟔𝟎)√ 𝟏 + 𝑿 𝒑( 𝑿 𝑻 𝑿) −𝟏 𝑿 𝒑 𝑻 … (𝟓𝟓) El intervalo de predicción de la ecuación … (𝟓𝟓) define el pronóstico para las generaciones del 2013 al 2014:
  • 21. 21 Para la generación 2013. En este caso, se define el pronóstico como un valor discreto, por lo tanto, 𝑝 = 13 y este se sustituye en la ecuación … (𝟓𝟓): 𝒚 𝟏𝟑 = 𝑿 𝟏𝟑 𝒂̂ ± (𝟐. 𝟐𝟔𝟐𝟏𝟔)(𝟐. 𝟕𝟔𝟎)√𝟏 + 𝑿 𝟏𝟑(𝑿 𝑻 𝑿)−𝟏 𝑿 𝟏𝟑 𝑻 … (𝟓𝟔) Entonces, para esta generación, su matriz pronóstico, que se define en la ecuación … (𝟑𝟒) es: 𝑿 𝟏𝟑 = [ 𝟏 𝒙 𝟏𝟑 ⋯ 𝒙 𝟏𝟑 𝟐 ] → 𝑿 𝟏𝟑 = [ 𝟏 𝟏𝟑 𝟏𝟔𝟗] →∴ 𝑿 𝟏𝟑 𝑻 = [ 𝟏 𝟏𝟑 𝟏𝟔𝟗 ] … (𝟓𝟕) Esto implica, encontrar la operación matricial 𝑿 𝟏𝟑 𝒂̂ , considerando el elemento matricial 𝑿 𝟏𝟑 de la ecuación … (𝟓𝟕) y el elemento matricial 𝒂̂ definido en la ecuación … (𝟓𝟑) y estos elementos matriciales se sustituyen en la ecuación … (𝟓𝟔): 𝒚 𝟏𝟑 = [ 𝟏 𝟏𝟑 𝟏𝟔𝟗] [ 𝟗𝟏. 𝟒𝟐𝟒𝟎𝟗 −𝟓. 𝟔𝟗𝟎𝟐𝟏 𝟎. 𝟑𝟕𝟖𝟖𝟏 ] ± (𝟐. 𝟐𝟔𝟐𝟏𝟔)(𝟐. 𝟕𝟔𝟎)√𝟏 + 𝑿 𝟏𝟑(𝑿 𝑻 𝑿)−𝟏 𝑿 𝟏𝟑 𝑻 … (𝟓𝟖) En la ecuación … (𝟓𝟖) se realiza su operación matricial del lado izquierdo de la bivalencia ± con el software wólfram alpha: http://www.wolframalpha.com/ donde se ejecuta la siguiente instrucción: {{1,13,169}}*{{91.42409},{-5.69021},{0.37881}} Esta sintaxis, da el resultado de esta operación matricial y por lo tanto este valor resultante se sustituye en la ecuación … (𝟓𝟖): 𝒚 𝟏𝟑 = 𝟖𝟏. 𝟒𝟕𝟎 ± (𝟐. 𝟐𝟔𝟐𝟏𝟔)(𝟐. 𝟕𝟔𝟎)√𝟏 + 𝑿 𝟏𝟑(𝑿 𝑻 𝑿)−𝟏 𝑿 𝟏𝟑 𝑻 … (𝟓𝟗) Luego, se efectúa la operación matricial √𝟏 + 𝑿 𝟏𝟑(𝑿 𝑻 𝑿)−𝟏 𝑿 𝟏𝟑 𝑻 , considerando el elemento matricial 𝑿 𝟏𝟑 de la ecuación … (𝟓𝟕) y los elementos matriciales 𝑿, 𝑿 𝑻 que están definidos en la ecuación … (𝟓𝟑) y estos elementos matriciales se sustituyen en la ecuación … (𝟓𝟗): 𝒚 𝟏𝟑 = 𝟖𝟏. 𝟒𝟕𝟎 ± (𝟐. 𝟐𝟔𝟐𝟏𝟔)(𝟐. 𝟕𝟔𝟎) √ 𝟏 + [ 𝟏 𝟏𝟑 𝟏𝟔𝟗] ( [ 𝟏 𝟏 𝟏 𝟏 𝟐 𝟒 𝟏 𝟑 𝟗 𝟏 𝟒 𝟏𝟔 𝟏 𝟓 𝟐𝟓 𝟏 𝟔 𝟑𝟔 𝟏 𝟕 𝟒𝟗 𝟏 𝟖 𝟔𝟒 𝟏 𝟗 𝟖𝟏 𝟏 𝟏𝟎 𝟏𝟎𝟎 𝟏 𝟏𝟏 𝟏𝟐𝟏 𝟏 𝟏𝟐 𝟏𝟒𝟒 ] [ 𝟏 𝟏 𝟏 𝟏 𝟏 𝟏 𝟏 𝟏 𝟏 𝟏 𝟏 𝟏 𝟏 𝟐 𝟑 𝟒 𝟓 𝟔 𝟕 𝟖 𝟗 𝟏𝟎 𝟏𝟏 𝟏𝟐 𝟏 𝟒 𝟗 𝟏𝟔 𝟐𝟓 𝟑𝟔 𝟒𝟗 𝟔𝟒 𝟖𝟏 𝟏𝟎𝟎 𝟏𝟐𝟏 𝟏𝟒𝟒]) −𝟏 [ 𝟏 𝟏𝟑 𝟏𝟔𝟗 ] … (𝟔𝟎)
  • 22. 22 Después, se realiza la multiplicación de matrices del paréntesis de la ecuación … (𝟔𝟎) con el software Matrixcalc: https://matrixcalc.org/es/slu.html y por lo tanto esta multiplicación matricial resulta: 𝒚 𝟏𝟑 = 𝟖𝟏. 𝟒𝟕𝟎 ± (𝟐. 𝟐𝟔𝟐𝟏𝟔)(𝟐. 𝟕𝟔𝟎)√ 𝟏 + [ 𝟏 𝟏𝟑 𝟏𝟔𝟗] ([ 𝟏𝟐 𝟕𝟖 𝟔𝟓𝟎 𝟕𝟖 𝟔𝟓𝟎 𝟔𝟎𝟖𝟒 𝟔𝟓𝟎 𝟔𝟎𝟖𝟒 𝟔𝟎𝟕𝟏𝟎 ]) −𝟏 [ 𝟏 𝟏𝟑 𝟏𝟔𝟗 ] … (𝟔𝟏) Esto implica, efectuar las operaciones matriciales del radicando de la ecuación … (𝟔𝟏) mediante el software wólfram alpha: http://www.wolframalpha.com/ donde se ejecuta la siguiente instrucción: {{1,13,169}}*inverse({{12,78,650},{78,650,6084},{650,6084,60710}})*{{1},{13},{169}} Esta sintaxis, da el resultado de esta operación matricial y por lo tanto este valor resultante se sustituye en la ecuación … (𝟔𝟏): 𝒚 𝟏𝟑 = 𝟖𝟏. 𝟒𝟕𝟎 ± (𝟐. 𝟐𝟔𝟐𝟏𝟔)(𝟐. 𝟕𝟔𝟎)√𝟏 + 𝟏. 𝟎𝟔𝟖𝟏𝟖 … (𝟔𝟐) Realizando operaciones elementales en el radicando de la ecuación … (𝟔𝟐): 𝒚 𝟏𝟑 = 𝟖𝟏. 𝟒𝟕𝟎 ± (𝟐. 𝟐𝟔𝟐𝟏𝟔)(𝟐. 𝟕𝟔𝟎)√𝟐. 𝟎𝟔𝟖𝟏𝟖 … (𝟔𝟑) Se encuentra la raíz cuadrada de la ecuación … (𝟔𝟑): 𝒚 𝟏𝟑 = 𝟖𝟏. 𝟒𝟕𝟎 ± (𝟐. 𝟐𝟔𝟐𝟏𝟔)(𝟐. 𝟕𝟔𝟎)(𝟏. 𝟒𝟑𝟖𝟏𝟏𝟔𝟖𝟐𝟒) … (𝟔𝟒) Luego, se efectúa la multiplicación del lado derecho de la bivalencia ± de la ecuación … (𝟔𝟒): 𝒚 𝟏𝟑 = 𝟖𝟏. 𝟒𝟕𝟎 ± 𝟖. 𝟗𝟕𝟖 … (𝟔𝟓) Finalmente, el resultado del intervalo de predicción de la ecuación … (𝟔𝟓) se interpreta de acuerdo a la definición del orden bivalente ± de la ecuación … (𝟑𝟓): 81.470 − 8.978 ≤ 𝑦13 ≤ 81.470 + 8.978 →∴ 𝟕𝟐. 𝟒𝟗% ≤ 𝒚 𝟏𝟑 ≤ 𝟗𝟎. 𝟒𝟒% … (𝟔𝟔) Para la generación 2014. En este caso, se define el pronóstico como un valor discreto, por lo tanto, 𝑝 = 14 y este se sustituye en la ecuación … (𝟓𝟓): 𝒚 𝟏𝟒 = 𝑿 𝟏𝟒 𝒂̂ ± (𝟐. 𝟐𝟔𝟐𝟏𝟔)(𝟐. 𝟕𝟔𝟎)√ 𝟏 + 𝑿 𝟏𝟒(𝑿 𝑻 𝑿)−𝟏 𝑿 𝟏𝟒 𝑻 … (𝟔𝟕)
  • 23. 23 Entonces, para esta generación, su matriz pronóstico, que se define en la ecuación … (𝟑𝟒) es: 𝑿 𝟏𝟒 = [𝟏 𝒙 𝟏𝟒 ⋯ 𝒙 𝟏𝟒 𝟐 ] → 𝑿 𝟏𝟒 = [ 𝟏 𝟏𝟒 𝟏𝟗𝟔] →∴ 𝑿 𝟏𝟒 𝑻 = [ 𝟏 𝟏𝟒 𝟏𝟗𝟔 ] … (𝟔𝟖) Esto implica, encontrar la operación matricial 𝑿 𝟏𝟒 𝒂̂ , considerando el elemento matricial 𝑿 𝟏𝟒 de la ecuación … (𝟔𝟖) y el elemento matricial 𝒂̂ definido en la ecuación … (𝟓𝟑) y estos elementos matriciales se sustituyen en la ecuación … (𝟔𝟕): 𝒚 𝟏𝟒 = [ 𝟏 𝟏𝟒 𝟏𝟗𝟔] [ 𝟗𝟏. 𝟒𝟐𝟒𝟎𝟗 −𝟓. 𝟔𝟗𝟎𝟐𝟏 𝟎. 𝟑𝟕𝟖𝟖𝟏 ] ± (𝟐. 𝟐𝟔𝟐𝟏𝟔)(𝟐. 𝟕𝟔𝟎)√ 𝟏 + 𝑿 𝟏𝟒(𝑿 𝑻 𝑿)−𝟏 𝑿 𝟏𝟒 𝑻 … (𝟔𝟗) En la ecuación … (𝟔𝟗) se realiza su operación matricial del lado izquierdo de la bivalencia ± con el software wólfram alpha: http://www.wolframalpha.com/ donde se ejecuta la siguiente instrucción: {{1,14,196}}*{{91.42409},{-5.69021},{0.37881}} Esta sintaxis, da el resultado de esta operación matricial y por lo tanto este valor resultante se sustituye en la ecuación … (𝟔𝟗): 𝒚 𝟏𝟒 = 𝟖𝟔. 𝟎𝟎𝟖 ± (𝟐. 𝟐𝟔𝟐𝟏𝟔)(𝟐. 𝟕𝟔𝟎)√ 𝟏 + 𝑿 𝟏𝟒(𝑿 𝑻 𝑿)−𝟏 𝑿 𝟏𝟒 𝑻 … (𝟕𝟎) Luego, se efectúa la operación matricial √𝟏 + 𝑿 𝟏𝟒(𝑿 𝑻 𝑿)−𝟏 𝑿 𝟏𝟒 𝑻 , considerando el elemento matricial 𝑿 𝟏𝟒 de la ecuación … (𝟔𝟖) y los elementos matriciales 𝑿, 𝑿 𝑻 que están definidos en la ecuación … (𝟓𝟑) y estos elementos matriciales se sustituyen en la ecuación … (𝟕𝟎): 𝒚 𝟏𝟒 = 𝟖𝟔. 𝟎𝟎𝟖 ± (𝟐. 𝟐𝟔𝟐𝟏𝟔)(𝟐. 𝟕𝟔𝟎) √ 𝟏 + [ 𝟏 𝟏𝟒 𝟏𝟗𝟔] ( [ 𝟏 𝟏 𝟏 𝟏 𝟐 𝟒 𝟏 𝟑 𝟗 𝟏 𝟒 𝟏𝟔 𝟏 𝟓 𝟐𝟓 𝟏 𝟔 𝟑𝟔 𝟏 𝟕 𝟒𝟗 𝟏 𝟖 𝟔𝟒 𝟏 𝟗 𝟖𝟏 𝟏 𝟏𝟎 𝟏𝟎𝟎 𝟏 𝟏𝟏 𝟏𝟐𝟏 𝟏 𝟏𝟐 𝟏𝟒𝟒 ] [ 𝟏 𝟏 𝟏 𝟏 𝟏 𝟏 𝟏 𝟏 𝟏 𝟏 𝟏 𝟏 𝟏 𝟐 𝟑 𝟒 𝟓 𝟔 𝟕 𝟖 𝟗 𝟏𝟎 𝟏𝟏 𝟏𝟐 𝟏 𝟒 𝟗 𝟏𝟔 𝟐𝟓 𝟑𝟔 𝟒𝟗 𝟔𝟒 𝟖𝟏 𝟏𝟎𝟎 𝟏𝟐𝟏 𝟏𝟒𝟒]) −𝟏 [ 𝟏 𝟏𝟒 𝟏𝟗𝟔 ] … (𝟕𝟏) Después, se realiza la multiplicación de matrices del paréntesis de la ecuación … (𝟕𝟏) y por lo tanto esta multiplicación matricial resulta: 𝒚 𝟏𝟒 = 𝟖𝟔. 𝟎𝟎𝟖 ± (𝟐. 𝟐𝟔𝟐𝟏𝟔)(𝟐. 𝟕𝟔𝟎)√ 𝟏 + [ 𝟏 𝟏𝟒 𝟏𝟗𝟔] ([ 𝟏𝟐 𝟕𝟖 𝟔𝟓𝟎 𝟕𝟖 𝟔𝟓𝟎 𝟔𝟎𝟖𝟒 𝟔𝟓𝟎 𝟔𝟎𝟖𝟒 𝟔𝟎𝟕𝟏𝟎 ]) −𝟏 [ 𝟏 𝟏𝟒 𝟏𝟗𝟔 ] … (𝟕𝟐)
  • 24. 24 Esto implica, efectuar las operaciones matriciales del radicando de la ecuación … (𝟕𝟐) mediante el software wólfram alpha: http://www.wolframalpha.com/ donde se ejecuta la siguiente instrucción: {{1,14,196}}*inverse({{12,78,650},{78,650,6084},{650,6084,60710}})*{{1},{14},{196}} Esta sintaxis, da el resultado de esta operación matricial y por lo tanto este valor resultante se sustituye en la ecuación … (𝟕𝟐): 𝒚 𝟏𝟒 = 𝟖𝟔. 𝟎𝟎𝟖 ± (𝟐. 𝟐𝟔𝟐𝟏𝟔)(𝟐. 𝟕𝟔𝟎)√𝟏 + 𝟏. 𝟗𝟒𝟗𝟑𝟎 … (𝟕𝟑) Realizando operaciones elementales en el radicando de la ecuación … (𝟕𝟑): 𝒚 𝟏𝟒 = 𝟖𝟔. 𝟎𝟎𝟖 ± (𝟐. 𝟐𝟔𝟐𝟏𝟔)(𝟐. 𝟕𝟔𝟎)√𝟐. 𝟗𝟒𝟗𝟑𝟎 … (𝟕𝟒) Se encuentra la raíz cuadrada de la ecuación … (𝟕𝟒): 𝒚 𝟏𝟒 = 𝟖𝟔. 𝟎𝟎𝟖 ± (𝟐. 𝟐𝟔𝟐𝟏𝟔)(𝟐. 𝟕𝟔𝟎)(𝟏. 𝟕𝟏𝟕𝟑𝟓𝟐𝟔𝟏𝟒) … (𝟕𝟓) Luego, se efectúa la multiplicación del lado derecho de la bivalencia ± de la ecuación … (𝟕𝟓): 𝒚 𝟏𝟒 = 𝟖𝟔. 𝟎𝟎𝟖 ± 𝟏𝟎. 𝟕𝟐𝟐 … (𝟕𝟔) Finalmente, el resultado del intervalo de predicción de la ecuación … (𝟕𝟔) se interpreta de acuerdo a la definición del orden bivalente ± de la ecuación … (𝟑𝟓): 86.008 − 10.722 ≤ 𝑦14 ≤ 86.008 + 10.722 →∴ 𝟕𝟓. 𝟐𝟖% ≤ 𝒚 𝟏𝟒 ≤ 𝟗𝟔. 𝟕𝟑% … (𝟕𝟕) Estos intervalos de predicción de las ecuaciones … (𝟔𝟔) y … (𝟕𝟕) se corrobora mediante el software de Octave-MATLAB desde: http://octave-online.net/ donde se consideran las siguientes instrucciones definidas a ejecutar:  [p,S] = polyfit(x,y,n): Da los coeficientes del polinomio p de grado n que se encontró manualmente en la ecuación … (𝟒𝟖) que ajusta los puntos (x,y) por mínimos cuadrados, con errores estimados S  [Y,D] = polyconf(p,X,S,alpha): Predicción polinómica con intervalos de confianza Y±D de la salida S dada por polyfit con nivel de confianza alpha (considerando la ecuación … (𝟑𝟒), se menciona que es del 95%, es decir 0.05) Estas instrucciones definidas, implica introducir las variables de los puntos del ajuste considerado, es decir (x,y)=(Generacion,Desercion) con el siguiente orden fundamental: octave:1>Desercion=[88.60,82.68,73.51,75.39,70.57,68.13,69.89,73.59, 73.78,74.13,74.34,74.87]; octave:2> Generacion=[1,2,3,4,5,6,7,8,9,10,11,12];
  • 25. 25 Luego, se agrega la instrucción de polyfit, definida en este caso como: octave:3> [p,S] = polyfit(Generacion,Desercion,2) p = 0.37881 -5.69021 91.42409 S = scalar structure containing the fields: yf = Columns 1 through 8: 86.113 81.559 77.763 74.724 72.443 70.920 70.154 70.146 Columns 9 through 12: 70.896 72.403 74.668 77.690 X = 1 1 1 4 2 1 9 3 1 16 4 1 25 5 1 36 6 1 49 7 1 64 8 1 81 9 1 100 10 1 121 11 1 144 12 1 En efecto, estos resultados concuerdan con los obtenidos en las ecuaciones … (𝟒𝟖) y … (𝟓𝟑). Por lo tanto, se corroboran los predichos intervalos estudiantiles en la generación 2013 y 2014 de desertores, esto implica considerar lo que se obtuvo de la implementación polyfit, para que se encuentre la última instrucción definida: octave:4> [Y,D] = polyconf(p,13,S,0.05) Y = 81.470 D = 8.978 octave:5> [Y,D] = polyconf(p,14,S,0.05) Y = 86.008 D = 10.722
  • 26. 26 Esta sintaxis ejecutada en el software de Octave-MATLAB, da certeza de nuestros resultados obtenidos manualmente en las ecuaciones … (𝟔𝟔) y … (𝟕𝟕), a razón de que estos valores son idénticos. En este trabajo se ha partido de la premisa de que un modelo estadístico paramétrico se encuentra especificado por medio del grado que determina el óptimo ajuste funcional polinomial, que este se logra con las variables que presentan mayor correlación a los datos incluidos y que el objetivo es realizar la estimación de intervalos predictivos, que dependen principalmente del nivel de confianza al 95% y de su vía asociada al percentil de la distribución 𝑡 de Student cuyos límites inferior y superior involucra qué para tamaños de muestras grandes, varía los resultados generacionales del 2013 al 2014 de la deserción estudiantil en la dependencia IEMSDF de la siguiente manera:  Para la generación 2013 su intervalo predictivo porcentual de la ecuación … (𝟔𝟔), se compara con el último valor obtenido en los datos del ajuste, es decir el porcentaje de la generación 2012; por lo tanto, se menciona que para su límite inferior el valor se considera optimista a razón de que es proporcional y en su límite superior el valor es fatalista por que incrementa significativamente la deserción estudiantil.  Para la generación 2014 su intervalo predictivo porcentual de la ecuación … (𝟕𝟕), se compara en los respectivos límites del intervalo obtenido en la ecuación … (𝟔𝟔), por lo tanto, se menciona que para su límite inferior el valor aumenta sustancialmente y en su límite superior el valor es catastrófico porque sigue incrementando la deserción estudiantil. Estos resultados conforman una banda única de confianza en los límites respectivos del intervalo, que refleja el error de muestreo de deserción estudiantil inherente al cálculo del error estándar de su dispersión generacional, cuyo tratamiento informativo en su valor porcentual, se interpreta a corto plazo, la cobertura de la eficacia terminal, cuya determinación, busque alentar a la dependencia, en incentivar la flexibilidad del modelo educativo en el sistema escolarizado, para considerar un panorama de permanencia a cada alumno que esté en riesgo de abandonar su plantel y esto promueva el alcance de retomar la facilitación de continuar los estudios con actitud comprometida, para que el aprendiz adquiera un sentido de responsabilidad, que estimule en su ser una formación de seguridad decisiva ante los conflictos de la vida, conllevando así, una visión de superación personal, que le genere competitividad exitosa, para poder culminar el logro de certificar su egreso con calidad trascendental al desarrollo profesional.
  • 27. 27 6. Conclusiones y futuras líneas de investigación En este trabajo se desarrolló un análisis de regresión por el método de mínimos cuadrados, que consistió en basar sus criterios de determinación, para generar una función polinomial óptima de ajuste a los datos generacionales, respectivamente a la extrapolación de un intervalo de predicción porcentual de estudiantes desertores, que:  Puede tomar una variable objetivo fuera del ámbito temporal o espacial.  Puede ser inferido a partir de un profundo estudio del pasado y aceptando que el comportamiento de los agentes históricos no se modifica sustancialmente.  Define cuál de los posibles valores futuros de la variable objetivo es más probable. Como futuro trabajo, sería interesante investigar las diferentes variantes de este problema, por ejemplo:  Amplificar la visibilidad de este modelo en regresión múltiple, cuyas muestras aleatorias sean el número de estudiantes que estén en situación de receso indefinido y el número de estudiantes que están dados de baja por la Subdirección de Administración Escolar del IEMSDF, para formular una hipótesis de comparación que pueda inferir la verdadera causa de deserción estudiantil en la dependencia.  Construir de este modelo una prueba de bondad de ajuste logístico de frecuencia estudiantil que esté dado de baja en la dependencia y que esté considerado en la situación de calidad indefinida de su receso en el plantel, para que muestre una variable de respuesta binaria de determinación analítica que explique el factor de la problemática que pueda tener el fenómeno de la deserción estudiantil del IEMSDF. En mi opinión, este análisis brinda a las autoridades competentes de esta dependencia un conjunto de técnicas estadísticas, que pueden complementar con su experiencia para el pronóstico de las principales variables de decisión, así como otorgar criterios para formular modelos que permitan explicar y predecir el comportamiento de los agentes involucrados a la deserción estudiantil.
  • 28. 28 7. Referencias bibliográficas  Anderson, David R. (2008) Estadística para Administración y Economía (10ª Edición) Ed. Cengage Learning.  Bittinger, Marvin L. (2002) Cálculo para Ciencias Económico-Administrativas. (7ª Edición) Ed. Pearson Educación.  Carrillo Ramírez, Teresa. (2008) Apuntes de Mínimos Cuadrados de la asignatura de Métodos Numéricos II para la Licenciatura en Matemáticas Aplicadas y Computación. Ed. FES-Acatlán-UNAM en: https://drive.google.com/file/d/0B- 8i8s0wQyqyYVRhUFBxUFI1OTQ/view?usp=sharing  Cannavos, George C. (1988) Probabilidad y Estadística: Aplicaciones y Métodos. (1ª Edición) Ed. McGraw-Hill Interamericana.  Chapra, Steven C. (2011). Métodos numéricos para ingenieros. (6ª Edición) Ed. McGraw-Hill Interamericana.  Díaz Martínez, Juan Pablo (2015) Deserción Escolar en la Educación Media Superior: Una aproximación logística Ed. UNAM-Facultad de Ciencias en: http://132.248.9.195/ptd2015/junio/306158177/Index.html  Figueroa García, Edith (2014) Métodos Probabilísticos de Optimización. Estado de México, Municipio de Naucalpan de Juárez. Ed. UNAM-FES Acatlán-Ingeniería Civil.  Gerald, Curtis F. (2000) Análisis Numérico con aplicaciones. (6ª Edición) Ed. Pearson Educación.  Gujarati, Damodar N. (2010) Econometría (5ª Edición) Ed. McGraw-Hill Interamericana.  Hines, William W. (1996) Probabilidad y Estadística para Ingeniería y Administración (2ª Edición) Ed. CECSA.  Infante Gil, Said. (2012) Métodos Estadísticos: Un Enfoque Interdisciplinario. (3ª Edición) Ed. La Gaya Ciencia-COLPOS-SAGARPA.  Lara Maldonado, Pedro Daniel. (2016) Análisis Estadístico y Probabilístico de la Deserción Escolar de los planteles del IEMSDF con amplio histórico generacional mediante el método de regresión por Mínimos Cuadrados. Ed. SEP-SES-UnADM- DCEIT-SECDMX-IEMSDF-GAM.I.-PBD en: https://drive.google.com/file/d/0B- 8i8s0wQyqyWlJEQjVHbjlobDQ/view?usp=sharing  Levin, Richard I. (2004) Estadística para Administración y Economía. (7ª Edición) Ed. Pearson Educación  Marín Salguero, Rafael. (2013). Temas Selectos de Matemáticas Preuniversitarias: “El Ajuste de Curvas funcionales por la vía del Método de Regresión por Mínimos Cuadrados.” Ed. IEMSDF-GAM.I. en: https://drive.google.com/file/d/0B- 8i8s0wQyqyUVdzSXVyM1FkcVZlYVBqdkR3REdaaFZ2MWtz/view?usp=sha ring
  • 29. 29  Marín Salguero, Rafael. (2014). Matemáticas Preuniversitarias: “Probabilidad y Estadística.” Ed. IEMSDF-GAM.I. en: https://drive.google.com/file/d/0B- 8i8s0wQyqyczRFOVhyRWk1R18wbHN1UlpQdGY2YkhPaFFF/view?usp=sha ring  Mathews, John H. (2000) Métodos Numéricos con MATLAB. (3ª Edición). Ed. Prentice-Hall.  Pérez López, César. (2002) MATLAB y sus aplicaciones en las ciencias y la ingeniería. Ed. Pearson Educación S.A.  Ponce de León Topete, María del Socorro. (2003) Guía para el seguimiento de Trayectorias Escolares a Nivel Medio Superior y Superior. (1ª Edición) Ed. DGP- UAEH, en http://intranet.uaeh.edu.mx/DGP/pdf/2_guia_trayectoria.pdf  Quintana Hernández, Pedro Alberto. (2005) Métodos Numéricos con Aplicaciones en Excel. Ed. Reverté-SEP-Gto. -ITC.  Sistema de Información Mexicana del Distrito Federal, INFOMEXDF. (2016) “Solicitud de Información Pública registrada y aprobada con el número de folio: 0311000001716; con los datos estadísticos estudiantiles del ingreso (apartado 4)) y del egreso (apartado 3)) desde su primera generación hasta su última generación en todos los planteles que la conforman.” Ed. DE-SAE-IEMSDF, en: http://www.infomexdf.org.mx/flslayer/seguimiento/d90c0f2c/06cd56f7/Respuest a%201716.pdf  Smith W, Allen. (1988) Análisis Numérico. Ed. Prentice-Hall Hispanoamericana S.A.  Spiegel, Murray R. (1970) Teoría y problemas de Estadística (1ra. Edición) Serie de Compendios Schaum Editorial McGraw-Hill.  Valdés Prada, Francisco José. (2014) Breviario sobre Modelado Matemático. (1ª Edición) Ed. CBI-UAM-Iztapalapa.  Wackerly, Dennis D. (2010) Estadística Matemática con Aplicaciones. (7ª Edición) Ed. Cengage Learning.