1. Instituto Tecnológico de Apizaco
INGENIERÍA EN SISTEMAS AUTOMORICES
DIESEO DE EXPERIMENTOS
M.I.A. JUAN MANUEL GARCIA BARRIOS
PRACTICA: ESTADISTICA DESCRIPTIVA
ALUMNOS: GUSTAVO AGUILAR HERNANDEZ
JONATHAN ARTURO GONZALES CUATECONTZI
ERICK WILLIAM PEREZ VELAZQUEZ
JOSE ARMANDO GARCIA SANCHEZ
EDWIN DIAZ HERNANDEZ
EDUARDO SALINAS CAMARILLO
20 DE SEPTIEMBRE DEL 2023
2. Contenido
1 INTRODUCCIÓN................................................................................................................................ 3
2 OBJETIVO (COMPETENCIA)............................................................................................................. 12
3 FUNDAMENTO TEORICO ................................................................................................................ 13
4 PROCEDIMIENTO (DESCRIPCIÓN)................................................................................................... 14
5 DESARROLLO DE LA PRÁCTICA ....................................................................................................... 15
6 RESULTADOS DEL APRENDIZAJE..................................................................................................... 18
7 ANEXOS .......................................................................................................................................... 19
8 REFERENCIAS................................................................................................................................. 21
Ilustración 1 Tabla de muestra sus unidades son meses, ................................................................. 15
Ilustración 2 Tabla con las clases y amplitudes calculadas ............................................................... 16
Ilustración 3 polígono d frecuencias ................................................................................................. 19
Ilustración 4 Diagrama de pastel....................................................................................................... 20
Ilustración 5 poligona de frecuencia acumulada .............................................................................. 20
Ilustración 6 Grafica de barra invertida ............................................................................................ 21
3. 1 INTRODUCCIÓN
Pretende introducir al estudiante en el conocimiento de las técnicas estadísticas
básicas, con el objetivo de que lo ayuden en su futuro profesional a la hora de
tomar decisiones en cualquier entorno laboral y de relaciones humanas. Para ello,
se desarrollan los principales instrumentos estadísticos que sirven para la
descripción, resumen y comprensión de la información disponible.
La estadística descriptiva es una ciencia que analiza series de datos (por ejemplo,
edad de una población, altura de los estudiantes de una escuela, temperatura en
los meses de verano, etc.) y trata de extraer conclusiones sobre el
comportamiento de estas variables.
En este trabajo podremos encontrar el desarrollo de un estudio de una población
(Unidades de transporte público). Con relación diferentes marcas de aceite para
poder determinar cuál es la que tiene mejor rendimiento para poder determinar la
confiabilidad y calidad del producto que podremos conseguir en el mercado.
1.2 Marco teórico
Las pruebas de bondad de ajuste tratan de verificar si el conjunto de datos se
puede ajustar o afirmar que proviene de una determinada distribución. Las
pruebas básicas que pueden aplicarse son: la ji-cuadrada y la prueba de Smirnov-
Kolmogorov. Ambas pruebas caen en la categoría de lo que en estadística se
denominan pruebas de "Bondad de Ajuste" y miden, como el nombre lo indica, el
grado de ajuste que existe entre la distribución obtenida a partir de la muestra y la
distribución teórica que se supone debe seguir esa muestra. Ambas pruebas están
basadas en la hipótesis nula de que no hay diferencias significativas entre la
distribución muestral y la teórica, HO es la distribución que se supone sigue la
muestra aleatoria.
4. La hipótesis alternativa siempre se enuncia como que los datos no siguen la
distribución supuesta. Hablamos de bondad de ajuste cuando tratamos de
comparar una distribución de frecuencia observada con los valores
correspondientes de una distribución esperada o teórica. Algunos estudios
producen resultados sobre los que no podemos afirmar que se contribuyen
normalmente, es decir con forma acampanada concentradas sobre la media.
Prueba x2
Esta prueba es aplicable para variables aleatorias discretas o continuas. una
muestra aleatoria de tamaño n tomada de una población con una distribución
especificada 10(x) que es de interés verificar suponer que las observaciones de la
muestra están agrupadas en k clases, siendo oi la cantidad de observaciones en
cada clase i 1, 2, k Con el modelo especificado 10(x) se puede calcular la
probabilidad Pi que un dato cualquiera pertenezca a una clase 1. Con este valor
de probabilidad se puede encontrar la frecuencia esperada ei para la clase i, es
decir, la cantidad de datos que según el modelo especificado deberían estar
incluidos en la clase i: ei pin, 1, 2, K tenemos entonces dos valores de frecuencia
para cada clase I oi: frecuencia observada (corresponde a los datos de la muestra)
Ejemplo: frecuencia esperada (corresponde al modelo propuesto)
La teoría estadística demuestra que la siguiente variable es apropiada para
realizar una prueba de bondad de ajuste:
5. Es considerada Como una prueba no paramétrica que mide la discrepancia
(bondad de ajuste) entre una distribución observada a partir de la muestra y otra
teórica que se supone que debe de seguir esa muestra, indicando en que medidas
las diferencias existentes entre ambas se deben al azar entre contraste de la
hipótesis.
Esta prueba se basa en la hipótesis nula (H) de que no hay diferencias
significativas entre la distribución muestral y la teórica. Mientras que la hipótesis
alternativa(H1) siempre se enuncia como que los datos no siguen la distribución
supuesta.
6. La estructura básica de la prueba para la bondad del ajuste se muestra en la
siguiente tabla
Propiedades de las distribuciones ji-cuadrada
1. Los valores de X ^ 2 son mayores o iguales que 0.
2. La forma de una distribución X ^ 2 depende del Gl=n-1. En consecuencia,
hay un número infinito de distribuciones x ^ 2
3. El área bajo una curva ji-cuadrada y sobre el eje horizontal es 1.4. Las
distribuciones x ^ 2 no son simétricas. Tienen colas estrechas que se
extienden a la derecha, esto es, están sesgadas a la derecha.
4. Cuando n>2, la media de una distribución X es n-1 y la varianza es 2(n – 1)
5. El valor modal de una distribución X ^ 2 se da en el valor (n-3).
7. Distribución ji-cuadrada, es una distribución de probabilidad. La distribución ji-
cuadrada tiene un sesgo positivo como se puede observar en la siguiente figura:
La distribución de ji-cuadrada, o chi-cuadrada, como también se le conoce, tiende
a la normalidad, tal y como se muestra en la siguiente figura a medida que
aumentan los grados de libertad.
8. Prueba kolmogorov-smirnov
En estadística la prueba de Kolmogorov-Smirnov (también prueba K-S) es una
prueba no paramétrica que determina la bondad de ajuste de dos distribuciones de
probabilidad entré sí. En el caso de que queramos verificar la normalidad de una
distribución, la prueba de Lilliefors conlleva algunas mejoras con respecto a la de
Kolmogorov-Smimov: y, en general, la prueba de Shapiro-Wilk Wilk o la prueba de
Anderson-Darling son alternativas más potentes. Conviene tener en cuenta que la
prueba Kolmogorov-Smimov es más sensible a los valores cercanos a la mediana
que a los extremos de la distribución. La prueba de Anderson- Darling proporciona
igual sensibilidad con valores extremos.
El procedimiento Prueba de Kolmogorov-Smirnov para una muestra compara la
función de distribución acumulada observada de una variable con una distribución
teórica determinada, que puede ser la normal, la uniforme, la de Poisson o la
exponencial. La Z de Kolmogorov-Smirnov se calcula a partir de la diferencia
mayor (en valor absoluto) entre las funciones de distribución acumuladas teórica y
observada. Esta prueba de bondad de ajuste contrasta si las observaciones
podrían razonablemente proceder de la distribución especificada.
9. Ejemplo
Muchas pruebas paramétricas requieren que las variables se distribuyan
de forma normal. La prueba de Kolmogorov-Smirnov para una muestra se
puede utilizar para comprobar que una variable (por ejemplo ingresos) se
distribuye normalmente.
Estadísticas
Media, desviación estándar, mínimo, máximo, número de casos no
perdidos, cuartiles, prueba de Lilliefors y simulación de Monte Carlo.
Pasos para realizar la prueba de Kolmogorov-Smimov
Partiendo del supuesto de que los datos son normales y que ya se conocen la
media y desviación se hace lo siguiente:
1. Identificar la muestra de la población a utilizar
2. Plantear la hipótesis para la muestra:Ho, hipótesis nula Hi
hipótesis alternativa.
3. Calcular la frecuencia observada de cada uno de los
intervalos, luego se suman todas las frecuencias
observadas.
4. 4 calcular la frecuencia observada relativa (frecuencia
observada de cada intervalo/la sumatoria total de la
frecuencia observada).
5. Luego se caícula las frecuencias observada relativa
acumulada (FOR A) y la frecuencia esperada relativa
acumulada (FERA) se calcula el Estadístico de Prueba (D)
de cada intervalo con la siguiente formula DABS (FOR
Acum-FER Acum)
6. Se busca en la siguiente tabla de acuerdo al tamaño de la muestra y un alfa
(o), el valor esperado:
10. N<40: se realiza el procedimiento normal
n>40: se aplica la formula que se expone en la tabla.
4.3 prueba de Anderson Darling
11. Dentro de la estadística, la prueba de Anderson Darling mide qué tan bien siguen
los datos una distribución específica. Para un conjunto de datos y distribución en
particular, mientras mejor se ajuste la distribución a los datos, menor será este
estadístico. Por ejemplo, se puede utilizar para determinar si los datos cumplen el
supuesto de normalidad para una prueba t. De igual forma, se puede usar para
comparar el ajuste de varias distribuciones con el fin de determinar cuál es la
mejor. Sin embargo, para concluir que una distribución es la mejor, el estadístico
de Anderson-Darling debe ser sustancialmente menor que los demás. Cuando los
estadísticos están cercanos entre sí, se deben usar criterios adicionales, como las
gráficas de probabilidad, para elegir entre ellos.
La prueba de Anderson-Darling se realiza en dos pasos: primero, se crean dos
distribuciones acumulativas, la primera es una distribución acumulativa de los
datos crudos y la segunda, es una distribución acumulativa normal y, segundo, se
12. comparan las dos distribuciones acumulativas para determinar la mayor diferencia
numérica absoluta entre ambas. De tal manera que, si la diferencia es amplia, se
rechaza la hipótesis nula, esto es, que los datos siguen una distribución normal
Por lo antes mencionado, en este trabajo, se investigarán los supuestos y
utilización de dicha prueba.
2 OBJETIVO (COMPETENCIA)
Conocer los conceptos básicos de población, muestra, variable y
estadística.
Distinguir los distintos tipos de variables y datos.
Agrupar la información estadística disponible en tablas de frecuencias.
Saber resumir una muestra estadística mediante medidas de tendencia,
dispersión, localización y forma.
Analizar datos de una y dos variables.
Entender el uso de métodos gráficos para mostrar los rasgos importantes
de una muestra.
Resolver problemas de probabilidad.
Utilizar modelos de variables aleatorias.
Determinar las relaciones existentes entre variables aleatorias.
13. 3 FUNDAMENTO TEORICO
Las variables pueden ser de dos tipos:
Variables cualitativas o atributos: no se pueden medir numéricamente (por
ejemplo: nacionalidad, color de la piel, sexo).
Variables cuantitativas: tienen valor numérico (edad, precio de un producto,
ingresos anuales).
Las variables también se pueden clasificar en:
Variables unidimensionales: sólo recogen información sobre una característica
(por ejemplo: edad de los alumnos de una clase).
Variables bidimensionales: recogen información sobre dos características de la
población (por ejemplo: edad y altura de los alumnos de una clase).
Variables pluridimensionales: recogen información sobre tres o más características
(por ejemplo: edad, altura y peso de los alumnos de una clase).
Por su parte, las variables cuantitativas se pueden clasificar en discretas y
continuas:
Discretas: sólo pueden tomar valores enteros (1, 2, 8, -4, etc.). Por ejemplo:
número de hermanos (puede ser 1, 2, 3., etc, pero, por ejemplo, nunca podrá ser
3,45).
Continuas: pueden tomar cualquier valor real dentro de un intervalo. Por ejemplo,
la velocidad de un vehículo puede ser 80,3 km/h, 94,57 km/h...etc.
Cuando se estudia el comportamiento de una variable hay que distinguir los
siguientes conceptos:
Individuo: cualquier elemento que porte información sobre el fenómeno que se
estudia. Así, si estudiamos la altura de los niños de una clase, cada alumno es un
individuo; si estudiamos el precio de la vivienda, cada vivienda es un individuo.
14. Población: conjunto de todos los individuos (personas, objetos, animales, etc.) que
porten información sobre el fenómeno que se estudia. Por ejemplo, si estudiamos
el precio de la vivienda en una ciudad, la población será el total de las viviendas
de dicha ciudad.
Muestra: subconjunto que seleccionamos de la población. Así, si se estudia el
precio de la vivienda de una ciudad, lo normal será no recoger información sobre
todas las viviendas de la ciudad (sería una labor muy compleja), sino que se suele
seleccionar un subgrupo (muestra) que se entienda que es suficientemente
representativo.
4 PROCEDIMIENTO (DESCRIPCIÓN)
EN LA SIGUIENTE TABLA ENCONTRAREMOS EL TIEMPO DE VIDA DE LOS
ACEITES DE MOTOR EN DIFERENTES MARCAS DE VEHICULOS, TOMANDO
ENCUENTA LA MARCA DE ACEITE CON UNA ESPECIFICACION DE 20W 50,
EN ESTE EJEMPLO PARA LA POBLACION EMPLEAMOS UNA FLOTILLA DE
TRASNPORTE PUBLICO DE UNA MISMA RUTA PARA NO TENER
VARIABILIDAD EN EL MODO DE CONDUCION.
En el trabajo realizado se han puesto en práctica distintos conceptos matemáticos
que se vieron en clase con los cuales es posible estudiar un conjunto de datos
para poder llegar a una conclusión.
15. Dentro de los aspectos calculados encontramos el número de clases, que debe
ser superior al valor más grande de todo el conjunto de datos, posteriormente se
determina el ancho o intervalo de cada clase, y también los límites de cada una.
Después se obtienen valores de Frecuencia de clase, Frecuencia acumulada,
frecuencia relativa, Frecuencia relativa acumulada y punto medio, todo esto con el
fin de poder calcular las medidas de tendencia central para datos agrupados y no
agrupados (media, mediana, moda).
Una vez obtenidos estos valores, es posible obtener las medidas de dispersión
para datos agrupados y no agrupados (amplitud de variación, varianza y
desviación estándar)
Por último con todos los valores obtenidos nos es posible representarlos
gráficamente con la ayuda de distintos tipos de grafica como lo son; histograma,
polígono de frecuencia, polígono de frecuencia acumulada, grafica de pastel y
grafica de barra invertida.
5 DESARROLLO DE LA PRÁCTICA
Como primer paso fue el obtener nuestra tabla de población
Ilustración 1 Tabla de muestra. (unidades en meses).
Después tenemos que determinar nuestra amplitud
2K =_>n
.n= número de datos
16. K= número de clases
para este caso n= 25 y k= 5
Después tenemos la amplitud donde 𝑖 =
𝐻−𝐿
𝐾
Ecuación de amplitud
Donde H= El dato mas grande 𝑖 =
38−17
5
L= el dato más pequeño i=4.2
Se redondea a 5
Después de esta podremos ordenar nuestras clases con la amplitud calculada
Ilustración 2 Tabla con las clases y amplitudes calculadas
Calculo de las clases con amplitud para obtener el límite inferior y límite superior.
17+5=22
22+5=27
27+5=32
32+5=37
37+5=42
FC= frecuencia de clase
Es el número de datos que encontramos en el rango establecido
17. FA= frecuencia acumulada
Es la frecuencia de clase más la del siguiente rango
Fr= frecuencia relativa
Se calcula con la frecuencia de clase entre el número total de datos
FRA= Frecuencia relativa acumulada
Es la suma de cada uno de los datos de frecuencia relativa
X= punto medio
𝑥 =
𝐿𝑠+𝐿𝑖
2
ecuación de punto medio
Después obtendremos la media
𝑋 = ∑ 𝐹𝑋/𝑛
𝑛
𝑖=𝑥
En este caso obtuvimos un valor de 25.7
MODA= el valor más repetido en nuestros datos en este caso 24
MADIANA=𝐿 + (
𝑛
2
−𝐹𝐶𝐴
𝐹
)
L= limite inferior de la clase que contiene la media
.n= numero de datos
FCA= frecuencia de clase acumulada que precede a la clase que contiene la
media
F=frecuencia de la clase que contiene la media
I=amplitud de clase
Para este caso obtuvimos un valor de 25.25
18. X2= los valores de x al cuadrado
FX2= la frecuencia de clase por x2
FX= frecuencia de clase por x
Ecuación de la varianza
𝑠2
=
[∑(𝑓)(𝑥2)] − [∑(𝑓)(𝑥)]2
𝑛 − 1
F=frecuencia de clase
X=punto medio
.n=total de datos
En este caso nos dio una valor de 155.45
Y la raíz cuadrada de este valor nos dará el valor de la desviación estándar
obteniendo 12.46
6 RESULTADOS DEL APRENDIZAJE
Proporcionar los instrumentos y técnicas del análisis descriptivo de la información
que se dispone de un determinado problema, además de adquirir destreza para
aplicar los métodos estadísticos al estudio científico de las disciplinas de las
19. ciencias del trabajo y de los recursos humanos, tanto como ser capaz de
reflexionar de forma crítica sobre los datos que se le presenten en diferentes
situaciones también de poder sistematizar la información numérica.
7 ANEXOS
Ilustración 3 polígono d frecuencias
21. Ilustración 6 Grafica de barra invertida
8 REFERENCIAS
1. Anderson, D. R. (2008). Estadística para administración y economía. (10ª. ed.) México : Cengage
Learning.
2. Box, G. E. P. (2008). Estadística para investigadores : Diseño, innovación y descubrimiento. (2ª.
Ed.). España : Reverté
3. Berenson, M. (2006). Estadística para administración. (4ª. ed.) México : Pearson Educación.
4. Carot, V. (2006). Control estadístico de la calidad. España : Alfaomega.
5. Devore, J. L. (2012) Probabilidad y estadística para ingenierías y ciencia. (8ª. ed.) México :
Cengage Learning.
6. Fernández, A. M. (2006). Ejercicios de econometría. (2006). España : McGraw-Hill.
7. Gamiz, B. E. (2012). Probabilidad y estadística con prácticas en Excel. (3ª. ed). México : JIT Press.