2. De la clase anterior
Uso y abuso de la estadística
• Cuidado con lo que asume.
• Sea claro acerca quiere descubrir.
• No tome la causalidad por sentado.
• Con estadística no se puede probar cosas con el
100% de certeza
• Un resultado que es numéricamente significativo
puede ser inútil.
Tomado de The Use and Misuse of statistics HBP.
Dr Jorge Ramírez Medina
EGADE Business School
3. Para la sesión de hoy
Solución de los problemas de Tarea
Problema de “El tuercas”
El
tuercas
5w-20
Motor Oil
Dr Jorge Ramírez Medina
EGADE Business School
4. Dr Jorge Ramírez Medina
EGADE Business School
s
m
x
Distribución Normal
𝑓(𝑥) =
1
𝜎 2𝜋
𝑒
−(𝑥−𝜇)2
2
5. Dr Jorge Ramírez Medina
EGADE Business School
Valores Z
Se interpreta como la cantidad de desviaciones
estándar que dista xi del promedio.
s
xx
z i
i
6. Dr Jorge Ramírez Medina
EGADE Business School
Z-scores
¿cómo
comparar
peras con
manzanas?
7. Dr Jorge Ramírez Medina
EGADE Business School
Un ejemplo
60 en estadística 60 en ética
8. Para entender;
Grafiquémoslo
• Tipo de datos
– Numéricos
– Medidas de tendencia central (media)
– Medidas de variabilidad (desviación estándar)
Dr Jorge Ramírez Medina
EGADE Business School
9. Primera idea
Dr Jorge Ramírez Medina
EGADE Business School
Nada es verdad, nada es mentira
Todo es según el cristal en que se mira
(Popular)
12. Cuarta idea
Dr Jorge Ramírez Medina
EGADE Business School
Z = (Score - Mean)/SD
Z = (60 - 50) / 10
Z = 1
Z = (Score - Mean)/SD
Z = (84 - 50) / 10
Z = 3.4
Z = (60 - 70) / 10
Z = -1.0
13. Z-scores
• Z-score puede ser positivo o negativo
– Positivo es arriba de la media
– Negativo es abajo de la media
• La media de un Z-score es siempre cero
• Si se tiene el promedio, el Z-score =0
• La desviación estándar de una distribución Z =1
Dr Jorge Ramírez Medina
EGADE Business School
15. Dr Jorge Ramírez Medina
EGADE Business School
Valores z
• z-Score del valor más pequeño (425)
-1.20 -1.11 -1.11 -1.02 -1.02 -1.02 -1.02 -1.02 -0.93 -0.93
-0.93 -0.93 -0.93 -0.84 -0.84 -0.84 -0.84 -0.84 -0.75 -0.75
-0.75 -0.75 -0.75 -0.75 -0.75 -0.56 -0.56 -0.56 -0.47 -0.47
-0.47 -0.38 -0.38 -0.34 -0.29 -0.29 -0.29 -0.20 -0.20 -0.20
-0.20 -0.11 -0.01 -0.01 -0.01 0.17 0.17 0.17 0.17 0.35
0.35 0.44 0.62 0.62 0.62 0.81 1.06 1.08 1.45 1.45
1.54 1.54 1.63 1.81 1.99 1.99 1.99 1.99 2.27 2.27
Valores estandarizados
20.1
73.54
8.490425
s
xx
z i
i
16. Dr Jorge Ramírez Medina
EGADE Business School
s 1
0
z
La letra z es utilizada para designar a la variable
normal aleatoria estandarizada.
Distribución de probabilidad
Normal estandarizada
s
m
x
z
17. Distribución de probabilidad
Normal estandarizada
Función de densidad normal estándar
donde:
z = (x – m)/s
= 3.14159
e = 2.71828
Dr Jorge Ramírez Medina
EGADE Business School
2
2
2
1
)(
z
exf
s
18. Dr Jorge Ramírez Medina
ITESM EGADE Zona Centro
Un uso de esto?
Teorema de Chebychev
Cuando menos (1 - 1/z2) de los elementos
en cualquier conjunto de datos debe estar
a menos de z desviaciones estándar
de separación respecto a la media,
siendo z cualquier valor mayor que 1.
19. Dr Jorge Ramírez Medina
ITESM EGADE Zona Centro
Teorema de Chebyshev
Cuando menos (1 - 1/z2) de los elementos
en cualquier conjunto de datos debe estar
a menos de z desviaciones estándar
de separación respecto a la media,
siendo z cualquier valor mayor que 1.
20. Dr Jorge Ramírez Medina
ITESM EGADE Zona Centro
Ejemplo
Tome z = 1.5 con = 490.80 and s = 54.74x
Al menos (1 - 1/(1.5)2) = 1 - 0.44 = 0.56 or 56%
de los valores deben estar entre
xx - z(s) = 490.80 - 1.5(54.74) = 409
y
x + z(s) = 490.80 + 1.5(54.74) = 573
(de hecho, 86% de los valores
están entre 409 y 573.)
21. Dr Jorge Ramírez Medina
ITESM EGADE Zona Centro
x
m – 3s m – 1s
m – 2s
m + 1s
m + 2s
m + 3sm
68.26%
95.44%
99.72%
Regla Empírica
23. Distribución de probabilidad
Normal estandarizada
Ejemplo: “El tuercas”
• Punto de reorden 20 litros
• La demanda durante el tiempo de resurtido esta
distribuida normalmente
• Media 15 lts, desv. est. 6 lts
El
tuercas
5w-20
Motor Oil
Dr Jorge Ramírez Medina
EGADE Business School
24. z = (x - m)/s
= (20 - 15)/6
= .83
Paso 1: Convierta x a la distribución normal estándar
El
Tuercas
5w-20
Motor Oil
Paso 2: encuentre el área bajo la curva normal
estandarizada a la izquierda de z = .83.
Distribución de probabilidad
Normal estandarizada
Dr Jorge Ramírez Medina
EGADE Business School
25. Tabla de probabilidad acumulada para la distribución
normal estandarizada
z .00 .01 .02 .03 .04 .05 .06 .07 .08 .09
. . . . . . . . . . .
.5 .6915 .6950 .6985 .7019 .7054 .7088 .7123 .7157 .7190 .7224
.6 .7257 .7291 .7324 .7357 .7389 .7422 .7454 .7486 .7517 .7549
.7 .7580 .7611 .7642 .7673 .7704 .7734 .7764 .7794 .7823 .7852
.8 .7881 .7910 .7939 .7967 .7995 .8023 .8051 .8078 .8106 .8133
.9 .8159 .8186 .8212 .8238 .8264 .8289 .8315 .8340 .8365 .8389
. . . . . . . . . . .
P(z < .83)
Distribución de probabilidad
Normal estandarizada
El
Tuercas
5w-20
Motor Oil
http://www.fisterra.com/mbe/investiga/distr_normal/distr_normal.htm
Dr Jorge Ramírez Medina
EGADE Business School
26. P(z > .83) = 1 – P(z < .83)
= 1- .7967
= .2033
Step 3: Calcule el área bajo la curva normal estandar
a la derecha de z = .83.
Probabilidad de
faltantes P(x > 20)
El
Tuercas
5w-20
Motor Oil
Distribución de probabilidad
Normal estandarizada
Dr Jorge Ramírez Medina
EGADE Business School
27. 0 .83
Area = .7967
Area = 1 - .7967
= .2033
z
El
Tuercas
5w-20
Motor Oil
Distribución de probabilidad
Normal estandarizada
Dr Jorge Ramírez Medina
EGADE Business School
28. Si se desea que la probabilidad de faltantes
no sea más de 0.05, cuál deberá ser el
punto de reorden?
El
Tuercas
5w-20
Motor Oil
Distribución de probabilidad
Normal estandarizada
Dr Jorge Ramírez Medina
EGADE Business School
29. 0
Area = .9500
Area = .0500
z
z.05
El
Tuercas
5w-20
Motor Oil
Distribución de probabilidad
Normal estandarizada
Dr Jorge Ramírez Medina
EGADE Business School
30. Paso 1: encuentre el valor de z que corta un área de .05
en la cola derecha de la distribución normal
estándar.
z .00 .01 .02 .03 .04 .05 .06 .07 .08 .09
. . . . . . . . . . .
1.5 .9332 .9345 .9357 .9370 .9382 .9394 .9406 .9418 .9429 .9441
1.6 .9452 .9463 .9474 .9484 .9495 .9505 .9515 .9525 .9535 .9545
1.7 .9554 .9564 .9573 .9582 .9591 .9599 .9608 .9616 .9625 .9633
1.8 .9641 .9649 .9656 .9664 .9671 .9678 .9686 .9693 .9699 .9706
1.9 .9713 .9719 .9726 .9732 .9738 .9744 .9750 .9756 .9761 .9767
. . . . . . . . . . .
Buscamos el complemento de el
área en la cola (1 - .05 = .95) El
Tuercas
5w-20
Motor Oil
Distribución de probabilidad
Normal estandarizada
Dr Jorge Ramírez Medina
EGADE Business School
31. paso 2: Convierta z.05 al correspondiente valor de x.
x = m + z.05s
= 15 + 1.645(6)
= 24.87 o 25
Un punto de reorden de 25 litros llevará la probabilidad
de faltantes durante el reabasto (poco menos de) .05.
El
Tuercas
5w-20
Motor Oil
Distribución de probabilidad
Normal estandarizada
Dr Jorge Ramírez Medina
EGADE Business School
32. Distribución de muestreo de
la media muestral
• Es la distribución de probabilidad de la
población de todas las posibles medias
muestrales que pueden ser obtenidas de
todas las posibles muestras del mismo
tamaño.
Dr. Jorge Ramírez Medina
EGADE Business School
34. Si se usa una muestra aleatoria simple grande
(n > 30) el teorema del límite central nos permite
concluir que la distribución de puede ser
aproximada como una distribución normal.
Cuando la muestra aleatoria simple es pequeña
(n < 30), la distribución de muestreo de puede ser
considerada normal sólo si asumimos que la
población tiene una distribución normal.
Forma de distribución
muestral de x
Dr Jorge Ramírez Medina
EGADE Business School
x
x
35. Una estimación del intervalo se puede calcular
por sumar y restar un margen de error del estimador
puntual:
Estimador puntual +/- Margen de Error
Margen de Error y
estimación de intervalos
Por ejemplo la forma general de una estimación del
intervalo para una media poblacional es:
Margen de Error
Dr Jorge Ramírez Medina
EGADE Business School
x
36. Estimación de intervalo de la
media de una Población : s
conocida
El margen de error puede ser calculado con:
– La desviación estándar de la población s , o
– La desviación estándar de la muestra s
s raramente se conoce con exactitud, se
pueden obtener estimados de datos
históricos.
Dr Jorge Ramírez Medina
EGADE Business School
37. m
/2 /2
Estimación de intervalo de la
media de una Población : s
conocida
x
Dr Jorge Ramírez Medina
EGADE Business School
Distribución de
Muestreo de
1 - de
todos los valores
de x
xz s 2/ xz s 2/
intervalo
incluye m
intervalo
no
incluye m
http://onlinestatbook.com/stat_sim/conf_interval/index.html
38. • Estimación de intervalo de m
donde: es la media muestral
1 - es el coeficiente de confidencia
z/2 es el valor z que provee un área de
/2 en la cola superior de la distribución
de probabilidad normal estandarizada
s es la desviación estándar de la población
n es el tamaño de la muestra
Estimación de intervalo de la
media de una Población : s
conocida
x
Dr Jorge Ramírez Medina
EGADE Business School
n
zx
s
2/
39. • Selección del tamaño de la muestra
en la mayoría de las aplicaciones, un tamaño de
muestra de n = 30 es adecuado.
Si la distribución de la población es de un alto sesgo
o contiene outliers, se recomienda un tamaño de
muestra de 50 ó más.
Estimación de intervalo de la
media de una Población : s
conocida
Dr Jorge Ramírez Medina
EGADE Business School
40. • Selección del tamaño de la muestra
si la población no está normalmente distribuida pero
es simétrica (+/-) un tamaño de muestra pequeño
de 15 es suficiente.
Si se cree que la distribución de la población es
aproximadamente normal, se puede utilizar un
tamaño de muestra de menos de 15.
Estimación de intervalo de la
media de una Población : s
conocida
Dr Jorge Ramírez Medina
EGADE Business School
41. • Ejemplo: DiscoSuena
Estimación de intervalo de la
media de una Población : s
conocida
n=36
U= $31,100
S= $4,500
Intervalo de confianza del 95%
x
s
Dr Jorge Ramírez Medina
EGADE Business School
42. 95% de las medias muestrales, están dentro de
un + 1.96 de la media poblacional m.sx
El margen de error es:
Estimación de intervalo de la
media de una Población : s
conocida
La estimación del intervalo para m es:
$31,100 + $1,470
o
$29,630 to $32,570
470,1
36
500,4
96.12/
n
z
s
Dr Jorge Ramírez Medina
EGADE Business School
43. Para el ejemplo de los autos
Dr. Jorge Ramírez Medina
EGADE Business School
44. • Si no se puede tener un estimado de la
desviación estándar de la población s se utiliza la
desviación estándar s de la muestra para estimar s .
• En este caso, la estimación del intervalo para m está
basada en la distribución t.
Estimación de intervalo de la
media de una Población : s
desconocida
Dr Jorge Ramírez Medina
EGADE Business School
45. La distribución t es una familia de distribuciones de
probabilidad similares.
Una distribución t específica depende de un
parámetro conocido como grados de libertad.
Los grados de libertad se refieren a el número de
piezas independientes de información que se usan
en el cálculo de s.
Distribución t
Dr Jorge Ramírez Medina
EGADE Business School
46. Conforme la distribución t tiene más grados de
libertad, ésta tiene menos dispersión.
Conforme se incrementan los grados de libertad,
la diferencia entre la distribución t y la distribución
de probabilidad normal estandarizada se hace más
pequeña.
Distribución t
William Sealy Gosset
Dr Jorge Ramírez Medina
EGADE Business School
48. Para más de 100 grados de libertad, el valor de z
normal estandarizado, da una buena aproximación
del valor t.
Los valores z normal estandarizados, se pueden
encontrar en la tabla t, con infinito grados de libertad.
Distribución t
Dr Jorge Ramírez Medina
EGADE Business School
49. Degrees Area in Upper Tail
of Freedom .20 .10 .05 .025 .01 .005
. . . . . . .
50 .849 1.299 1.676 2.009 2.403 2.678
60 .848 1.296 1.671 2.000 2.390 2.660
80 .846 1.292 1.664 1.990 2.374 2.639
100 .845 1.290 1.660 1.984 2.364 2.626
.842 1.282 1.645 1.960 2.326 2.576
Valores z
normal estandarizados
Distribución t
Dr Jorge Ramírez Medina
EGADE Business School