Este documento presenta los 19 pasos para realizar el ajuste de curva de datos no agrupados mediante el método de frecuencias absolutas. En primer lugar, se ordenan y agrupan los datos originales en una tabla. Luego, se calculan las medidas de tendencia central como la media, mediana y moda, así como las medidas de dispersión como la varianza y desviación estándar. Finalmente, se generan tablas con los intervalos de clase, frecuencias absolutas y relativas para graficar la curva de ajuste.
Estadio cognoscente - tratamiento de datos y ajuste de curva (WORD)
1. UNIVERSIDAD GRAN MARISCAL DE AYACUCHO
FACULTAD DE INGENIERÍA
POST- GRADO DE INGENIERÍA DE MANTENIMIENTO
MENSIÓN: GERENCIA DE SEGURIDAD Y CONFIABILIDAD INDUSTRIAL
NÚCLEO EL TIGRE
CÁTEDRA: ESTADISTICA APLICADA
ESTADIO COGNOSCENTE I: TRATAMIENTO DE DATOS
AJUSTE DE CURVA
FACILITADOR: Lcda. Esp. MSc. Carlena Astudillo
ENT N° 2
Ing. Sheyla Caraballo 11658645
Ing. Roberto Richer 15845751
Ing. Francis Cairo 18229245
EL TIGRE, MAYO DE 2016.
2. Estadio Cognoscente I: Tratamiento de Datos Ajuste de Curva
ASIGNACION PRÁCTICA
Ejercicio # 1
1) Se realizó un estudio sobre los niveles de productividad según lo obtenido mediante
el doble producto eficiencia y eficacia, obteniéndose los siguientes niveles de
competitividad empresarial (Ver tabla), realice el tratamiento de datos con su
respectiva interpretación.
Tabla de Datos
100 13 82 91
85 11 55 78
13 17 37 72
22 30 41 72
35 47 68 73
56 75 98 74
Tabla N° 1: Datos no agrupados
N°
(1)
DATO
ORIGINAL
(2)
DATO
ORDENADO
(3)
FREC.
REPETICION
(4)
1 100 11 1
2 85 13
2
3 13 13
4 22 17 1
5 35 22 1
6 56 30 1
7 13 35 1
8 11 37 1
9 17 41 1
10 30 47 1
11 47 55 1
12 75 56 1
13 82 68 1
14 55 72
2
15 37 72
16 41 73 1
17 68 74 1
18 98 75 1
19 91 78 1
20 78 82 1
21 72 85 1
22 72 91 1
23 73 98 1
24 74 100 1
∑ 24
Paso # 1.
Se elabora una tabla que
presente lo siguiente:
a. El número secuencial
de los datos.
b. Los datos no
agrupados que
originalmente se
muestran en la tabla
N°1.
c. Los datos ordenados
de forma ascendente.
d. La frecuencia con que
se repiten cada uno
de los datos
presentados.
e. Se suma la columna
(4) y ésta
representará el valor
de N. Tabla N° 2: Datos agrupados
3. Observación.
El Valor de N también se obtiene, de la siguiente formula.
N = Filas x columnas
La tabla original de datos viene representada por 6 filas y 4 columnas, por lo tanto,
N= 6 x 4 = 24 → N= 24
Paso # 2.
De la tabla N° 2, se ubica el dato mayor (D) y el dato menor (d), es decir:
D= 100 y d = 11
Ahora con estos datos se calcula la Amplitud total (AT), mediante la siguiente fórmula:
AT= D – d, sustituyendo los datos, tenemos AT= 100 – 11 → AT = 89
Paso # 3.
Se calcula Número de clase o intervalos (Ni), mediante la siguiente fórmula:
Ni = 1+3,3 Log(N), siendo N=24
Ni = 1+ 3,3 log (24) → Ni = 1+(3,3 x1.38) → Ni = 1+4,55 → Ni = 5,55 ≈ 6 → Ni = 6
Paso # 4.
Se calcula el tamaño o intervalo de clase (i), mediante la siguiente fórmula:
Ni
AT
i Sustituyendo los datos de AT y Ni, tenemos
83,14=
6
89
=i ≈ 15 por tanto, i = 15
4. Paso # 5.
Se calcula el límite inferior (Li)
Li = Xi – 0,5
Donde Xi es el valor inferior de la clase, es decir Xi = 11
Li = 11 – 0,5 = 10,5
Li = 10,5
Paso # 6.
Se procede a calcular el rango de cada clase (Xi,Xs).
Para la primera clase, se toma el valor inferior de los datos (Xi), que es Xi = 11, luego se
calcula el valor superior (Xs), que será igual a (Xi) más el tamaño de clase (i) menos uno (1),
es decir,
Xs = (Xi + i) – 1
Xs = (11+15) – 1
Xs = 25
Para la segunda clase, el valor de Xi será Xs anterior más uno y así sucesivamente.
Paso # 6.
Se calcula el límite superior (Ls)
Ls = Xs + 0,5
Donde Xs es el valor superior de la clase, Xs = 25
Ls = 25 + 0,5
Ls = 25,5
Cabe mencionar, que teniendo (Ls) también se puede obtener (Xs), a través de la siguiente
fórmula:
Xs = Ls – 0,5 → Xs = 25,5 – 0.5
Xs = 25
5. Paso # 7.
Se calcula la marca de clase (X) para cada uno de los intervalos o clases (Ni), mediante la
siguiente fórmula:
2
)( XsXi
X
, por ejemplo para Ni (1) seria:
18
2
)2511(
X para el Ni # 1, esto aplica para cada una de los Ni,
Paso # 8.
Se calcula la frecuencia absoluta (f), para ello, nos ubicamos en la tabla N°2, indicada al
inicio del ejercicio y la cual mostramos nuevamente para conocer el número de datos que se
encuentra en cada intervalo y su frecuencia.
Tabla N° 2: Datos agrupados
N°
(1)
DATO
ORIGINAL
(2)
DATO
ORDENADO
(3)
FREC.
REPETICION
(4)
∑
FREC.
1 100 11 1
5
2 85 13
2
3 13 13
4 22 17 1
5 35 22 1
6 56 30 1
37 13 35 1
8 11 37 1
9 17 41 1
310 30 47 1
11 47 55 1
12 75 56 1 2
13 82 68 1
14 55 72
2
8
15 37 72
16 41 73 1
17 68 74 1
18 98 75 1
19 91 78 1
20 78 82 1
21 72 85 1
22 72 91 1
323 73 98 1
24 74 100 1
∑ 24 24
Ni Xi-Xs f
1 11-25 5
2 26-40 3
3 41-55 3
4 56-70 2
5 71-85 8
6 86-100 3
24
Frecuencia absoluta (f)
6. Paso # 9.
Se procede a calcular la Frecuencia absoluta acumulada (F), de la siguiente forma:
Ni #1, la frecuencia absoluta acumulada (F) será igual a la frecuencia absoluta (f) de esa
clase es decir,
Ni f F
1 5 5
En la Ni # 2, la frecuencia absoluta acumulada (F) será igual a (F) del Ni # 1, que en este
caso es 5, más (f) del Ni # 2 que es 3, para un total de 8. De esta manera y de forma
sucesiva se calcula (F) para todos los (Ni),
Ni f F
1 5 5
2 3 8
Paso # 10.
Se calcula la frecuencia relativa (h), mediante la fórmula siguiente:
h = f / N, este cálculo se realiza para todos los Ni, es decir
Paso # 11.
Se calcula la frecuencia relativa acumulada (H), mediante la
fórmula siguiente:
H = F/N, este cálculo se realiza para todos los Ni, siendo N=24
Ni f f/h h
1 5 5/24 0,208
2 3 3/24 0,125
3 3 3/24 0,125
4 2 2/24 0,083
5 8 8/24 0,333
6 3 3/24 0,125
N= 24 1,00
Ni F F/N H
1 5 5/24 0,208
2 8 8/24 0,333
3 11 11/24 0,458
4 13 13/24 0.542
5 21 21/24 0,875
6 24 24/24 1,00
1,00
7. Importante destacar que la frecuencia relativa acumulada (H), viene dada por el mismo
principio descrito en el paso # 9, solo que en esta ocasión se realizan los cálculos con la
variable h y H.
Paso # 12.
Se calcula el porcentaje de los datos (P), por cada intervalo o clase. Este cálculo viene
dado por la siguiente fórmula:
P = H x 100%, dando como resultado lo siguiente
Paso # 13.
Se calcula la media aritmética ( X ), para cada uno de los intervalos, utilizando la siguiente
fórmula:
N
X*fΣ
=X
Ni h H
1 0,208 0,208
2 0,125 0,333
3 0,125 0,458
4 0,083 0,541
5 0,333 0,874
6 0,125 1,00
1,00
Ni H P
1 0,21 20,83%
2 0,33 33.33%
3 0,46 45.83%
4 0,54 54.17%
5 0,88 87.50%
6 1,00 100%
Ni X F f*X X
1 18 5 90 3.75
2 33 3 99 4.13
3 48 3 144 6
4 63 2 126 5.25
5 78 8 624 26
6 93 3 279 11,63
1362 57
8. Paso # 14.
Se calcula la media geométrica (G), que viene dada por la siguiente fórmula:
( ) ( ) ( )fnXn...2f2Xn *1f1X=G Siendo N = 24
Ni X f X^f
1 18 5
1889568
2 33 3
35937
3 48 3
110592
4 63 2
3969
5 78 8
1370114370683140
6 93 3
804357
24 ∑ 3,2848E+40
( ) ( ) ( ) ( ) ( ) ( )3823324 5
93*78*63*48*33*18=G
G =24 40+3,2848E
G = 48,77 ≈ 49
G = 49
Paso # 15.
Se calcula la media armónica (Ha), mediante la siguiente fórmula:
40=
93
3
+
78
8
+
63
2
+
48
3
+
33
3
+
18
5
24
=
X
f
Σ
N
=Ha
Ha = 40
Ni X f f/X
1 18 5 0,28
2 33 3 0,09
3 48 3 0,06
4 63 2 0,03
5 78 8 0,10
6 93 3 0,03
24 0,60
9. Paso # 16
Se calcula la mediana (Md)
i*
fmediana
Fanterior
2
N
+Li=Md , donde N = 24
Entonces
2
N
= 12
La clase mediana más cercana a la distribución central, es la 4ta clase con 54,17%, ya
que el valor medio de N, que es 12 se encuentra contenido en la frecuencia absoluta
de la clase 4, es decir en la frecuencia acumulada (F)=13.
Sustituyendo los datos, tenemos
100=15*
2
+5,55=4Md
11-12
Ni Li Xi-Xs X f F P
1 10,5 11-25 18 5 5 20,83%
2 25,5 26-40 33 3 8 33.33%
3 40,5 41-55 48 3 11 45.83%
4 55,5 56-70 63 2 13 54.17%
5 70,5 71-85 78 8 21 87.50%
6 85,5 86-100 93 3 24 100%
24
Md= 63
Paso # 17
Se calcula la moda (Mo)
iLiMo *
21
1
Donde;
∆1 = fmo –fmo inferior de la clase anterior ó f(mo-1) y,
∆2 = fmo –fmo superior ó f(mo+1)
10. Ahora, tenemos que localizar nuestra clase modal y para ello recurrimos al concepto de
que Moda es el que más veces se repite. Por tanto los valores que más se repiten se
encuentran en la clase o intervalo Ni # 5 siendo f =8
Ni Li Xi-Xs Ls X f
1 10,5 11-25 25,5 18 5
2 25,5 26-40 40,5 33 3
3 40,5 41-55 55,5 48 3
4 55,5 56-70 70,5 63 2
5 70,5 71-85 85,5 78 8
6 85,5 86-100 100,5 93 3
24
Entonces, fmo = 8 f(mo-1)= 2 f(mo+1) = 3 Li = 70,5 i = 15
∆1 = 8 – 2 = 6 → ∆1 =6
∆2 = 8 –3 = 5 → ∆2 =5
Sustituimos en la formula los datos,
iLiMo *
21
1
15*
5+6
6
+5,70=Mo = 78,68 ≈ 79
Mo = 79
Paso # 18
Se calcula la varianza (S²) y la desviación (S)
N
)XX(Σ
=
N
)XX(Σ
=S
22
2
S² = 15462 S² = 644
24
644=
24
15462
=S
S = 25
Ni Li Xi-Xs f
4 55,5 56-70 2
5 70,5 71-85 8
6 85,5 86-100 3
11. Paso # 19
Se calculan los percentiles (Pk), considerando K=80
i*
fi
fanterior
100
k*N
+Li=Pk
-
82=15*
8
13
100
80*24
+5,70=P80
-
→ P80 = 82
Paso # 20
Se calculan los deciles (Dk), considerando k=9
i*
fi
fanterior
10
k*N
+Li=Dk
87=15*
8
10
9*24
+5,70=D9
13-
→ D9 = 87
Paso # 21
Se calculan los cuartiles (Qk), considerando k=3
i
fi
fanterior
kN
LiQk *4
*
91=15*
3
5
4
3*24
+5,25=Q3
-
→ Q3 = 91
12. Paso # 22
Se tabulan los resultados
Ni Li i Ls Xi Xs X f F h H % F x X X^f f/x
(X - ) (X - )² (X - ) ²
N
1 10,5 15 25,5 11 25 18,00 5 5,00 0,21 0,21 20,83 90,00 3,75 1889568 0,28 14,25 203,06 8,46
2 25,5 15 40,5 26 40 33,00 3 8,00 0,13 0,33 33,33 99,00 4,13 35937 0,09 28,88 833,77 34,74
3 40,5 15 55,5 41 55 48,00 3 11,00 0,13 0,46 45,83 144,00 6,00 110592 0,06 42,00 1764,00 73,50
4 55,5 15 70,5 56 70 63,00 2 13,00 0,08 0,54 54,16 126,00 5,25 3969 0,03 57,75 3335,06 138,96
5 70,5 15 85,5 71 85 78,00 8 21,00 0,33 0,88 87,50 624,00 26,00 1370114370683140 0,10 52,00 2704,00 112,67
6 85,5 15 100,5 86 100 93,00 3 24,00 0,13 1,00 100,00 279,00 11,63 804357 0,03 81,38 6621,89 275,91
333 24 1 1362 57 0,60 276 15462 644
Paso # 23
Se toman los datos que vamos a graficar
Ni Xi Xs f F h H
1 11 25 5 5 20,83% 20,83%
2 26 40 3 8 12,5% 33.33%
3 41 55 3 11 12,5% 45,83%
4 56 70 2 13 8,33% 54,16%
5 71 85 8 21 33,33% 87,50%
6 86 100 3 24 12,5% 100%
24 100%
X
X X X
13. Paso # 23
Se grafían los resultados
5
20,83%
3
12,50%
3
12,50% 2 8,33%
8
33,33%
3
12,50%
0
2
4
6
8
11 a 25 26 a 40 41 a 55 56 a 70 71 a 85 86 a 100
Niveles de productividad % eficacia y eficiencia
Paso # 24 Se procede a interpretar los resultados
Del estudio estadístico sobre los niveles de productividad mediante el doble producto eficiencia y eficacia, se concluye que
de los 24 trabajadores con niveles de competitividad empresarial, 8 que representan el 33,33% de la muestra y que se
encuentran en el intervalo de clase 5 (71 a 85), demuestran ser eficientes, eficaces y con un nivel de productividad
esperado, sin embargo también se puede observar en la grafica que, 5 trabajadores representando el 20,83% de la
muestra están en vía de aumentar sus niveles de competitividad empresarial. Para el resto de los trabajadores que tienen
un nivel bajo de rendimiento y lo cual indirectamente afectan la productividad, la alta Gerencia de la empresa debe
establecer estrategias de incentivo y motivación para reforzar las actitudes positivas y aumentar el rendimiento de sus
trabajadores y de esta manera contribuyan a fortalecer los niveles de eficiencia, eficacia y productividad empresarial.
14. Ejercicio # 2
Calcule el nivel de correlación mediante la aplicación de la recta de regresión de
mínimos cuadrados tal que un modelo o instrumento es confiable en la medida que
la correlación se acerque a 1. Se desea verificar el nivel de confiabilidad de un
cuestionario para evaluar el mantenimiento de una empresa con base a la norma
covenin 2500’93 con una primera aplicación en x, y segunda aplicación en y, tal como
se indica en la tabla:
Paso # 1
Aplicamos la fórmula para los cálculos correspondientes
RYX = N∑XY - ∑X∑Y
√ N∑X² - (∑X) ² x (N∑Y²) x (N∑Y)²
N X Y XY X2
Y2
1 1200 1500 1800000 1440000 2250000
2 1000 1200 1200000 1000000 1440000
3 1000 1100 1100000 1000000 1210000
4 1100 1300 1430000 1210000 1690000
5 1000 1000 1000000 1000000 1000000
6 1000 1100 1100000 1000000 1210000
7 1300 1700 2210000 1690000 2890000
8 1700 1500 2550000 2890000 2250000
9 1000 1000 1000000 1000000 1000000
10 1500 1200 1800000 2250000 1440000
∑ 11800 12600 15190000 14480000 16380000
16. Paso # 3
Se grafican los resultados
Paso # 4
Interpretación de resultados
Al aplicar esta fórmula antes mencionada se obtuvo el siguiente valor 0,6082 siguiendo de
este resultado se verifica la correlación correspondiente sabiendo que: mayor a 0.80 es alta
de 0.50 es media y menos de 0.50 es baja, analizando el resultado de RXY podemos decir
que esta en un valor entre media y alta confiabilidad.