3. Dr. Jorge Ramírez Medina
Definición de Estadística
Es la ciencia pura y aplicada que trata de la
recolección, organización, presentación y
análisis de conjuntos de datos con el fin de
obtener conclusiones o inferencias y
establecer su grado de incertidumbre
Fuente: Estadística para Administración y Economía. Anderson, Sweeney y Williams
4. Dr. Jorge Ramírez Medina
Tiene que ver con
la toma de decisiones
catastrophic$(e.g.,$the$model$predicts$that$the$bridge$will$collapse$in$a$strong$wind,$causing$the$real$
bridge$to$be$closed$down,$creating$100Jmile$tailbacks$with$everyone$stranded$in$the$snow;$all$of$
which$was$unnecessary$because$the$real$bridge$was$perfectly$safe—the$model$was$a$bad$
representation$of$reality).$We$can$have$some$confidence,$but$not$complete$confidence,$in$
predictions$from$this$model.$The$final$model$is$completely$different$to$the$realJworld$situation;$it$
bears$no$structural$similarities$to$the$real$bridge$and$is$a$poor$fit.$As$such,$any$predictions$based$on$
this$model$are$likely$to$be$completely$inaccurate.$Extending$this$analogy$to$science,$it$is$important$
when$we$fit$a$statistical$model$to$a$set$of$data$that$it$fits$the$data$well.$If$our$model$is$a$poor$fit$of$
the$observed$data$then$the$predictions$we$make$from$it$will$be$equally$poor.$
$
$
Figure'2.2:'Fitting'models'to'real5world'data'(see'text'for'details)'
Jane'Superbrain'Box'2.1'Types'of'statistical'models'(1)'
The Real World
Good Fit Moderate Fit Poor Fit
Fuente: Field Andy. Discovering Statistics using IBM SPSS Statistics 2013.
5. Dr. Jorge Ramírez Medina
Escalas de medición
Cualitativos Cuantitativos
Numéricos NuméricosNo numéricos
Datos
Nominal Ordinal Nominal Ordinal Intervalo Razón
6. Dr. Jorge Ramírez Medina
Tablas de frecuencia
Cualitativos
No numéricos
Datos
Nominal Ordinal
Frecuencia
Frecuencia
relativa
Porcentaje
de frecuencia
malo 3 0.15 15%
regular 4 0.2 20%
bueno 2 0.1 10%
muy bueno 6 0.3 30%
excelente 5 0.25 25%
Total 20 1 100%
7. Dr. Jorge Ramírez Medina
Modelos estadísticos simples
• Medidas de tendencia Central
• Media, Moda, Mediana
• Medidas de dispersión
• Varianza, Desviación estándar
8. Dr. Jorge Ramírez Medina
Moda
RelativeFrequency
.05
.10
.15
.20
.25
.30
.35
0
corresponde al punto más alto de la gráfica
9. Dr. Jorge Ramírez Medina
Mediana
RelativeFrequency
.05
.10
.15
.20
.25
.30
.35
0
Divide la gráfica en dos áreas iguales
50% de los datos 50% de los datos
11. Dr. Jorge Ramírez Medina
Cálculo en el ejemplo
54.74
100 % 100 % 11.15%
490.80
s
x
2
2996.47 54.74s s
La desviación
estándard
es cerca del
11% de la media
• Varianza
• Desviación estándar
• Coeficiente de Variación
2
2 ( )
2,996.16
1
ix x
s
n
12. Dr. Jorge Ramírez Medina
Estadística Descriptiva
Son los métodos tabulares , gráficos y
numéricos utilizados para sumarizar datos.
14. Dr. Jorge Ramírez Medina
Diagrama de Caja
325 400 425 450 475 500 525 550 575 600 645
Q1 = 445 Q3 = 525
Q2 = 475
Los bigotes (líneas punteadas) se dibujan del final de la caja a los valores más grandes y
pequeños dentro de los límites
Valor más bajo= 425
Mayor valor= 615
15. Dr. Jorge Ramírez Medina
Diagrama de Caja
Sentida Falsa Miserable Neutra
17. Dr. Jorge Ramírez Medina
Estadística Inferencial
El propósito de esta rama es obtener
predicciones de una población con base en
información obtenida de una muestra.
19. Dr. Jorge Ramírez Medina
Variable aleatoria
Una variable aleatoria es una descripción numérica
del resultado de un experimento.
Una variable aleatoria discreta puede asumir un
número finito de valores o una secuencia infinita de
Valores.
Una variable aleatoria continua puede asumir
cualquier valor numérico en una intervalo o un
conjunto de intervalos.
20. Dr. Jorge Ramírez Medina
Tome x = número de TVs vendidas en la tienda
en un día. x puede tomar 5 valores (0, 1, 2, 3, 4)
Ejemplo: Tiendas de Todo
Variable aleatoria discreta con un número
finito de valores.
21. Dr. Jorge Ramírez Medina
Ejemplo: Tiendas de Todo
Variable aleatoria discreta con un número
infinito de valores.
Podemos contar los clientes pero no hay un límite finito de los que
puedan llegar.
Tome x = número de clientes que llegan a la tienda
en un día. x puede tomar 5 valores 0, 1, 2, 3, 4…..
22. Dr. Jorge Ramírez Medina
Variable Aleatoria
Pregunta Random Variable x Type
Tamaño de
La familia
x = Número of dependientes
reportados para el censo
Discreta
Distancia de la
casa a la escuela
x = Distancia en kms. de la
casa a la escuela
Continua
Tener mascota
perros y/o
gatos
x = 1 si no tiene mascota;
= 2 si tiene perro(s) únicamente;
= 3 si tiene gato(s) únicamente;
= 4 si tiene perro(s) y gatos(s)
Discreta
23. Dr. Jorge Ramírez Medina
Distribuciones de
probabilidad discretas
La distribución de probabilidad de una variable
aleatoria describe como las probabilidades están
distribuidas sobre los valores de la variable.
Podemos representar la distribución discreta de
probabilidad con una tabla, una gráfica o una ecuación.
24. Dr. Jorge Ramírez Medina
Distribuciones de
probabilidad discretas
La distribución de probabilidad está definida por una función
de probabilidad, f(x), la cuál provee la probabilidad para
cada valor de la variable aleatoria.
Las condiciones requeridas para una función de
Probabilidad discreta son;
f(x) > 0
f(x) = 1
25. Dr. Jorge Ramírez Medina
Utilizando los datos de ventas de TV’s desarrolle una representación tabular
de la distribución de probabilidad de las ventas de TVs
Unidades Número
Vendidas de días
0 80
1 50
2 40
3 10
4 20
200
x f(x)
0 .40
1 .25
2 .20
3 .05
4 .10
1.00
80/200
Distribuciones de
probabilidad discretas
.10
.20
.30
.40
.50
0 1 2 3 4
Valores de la Variable Aleatoria x (ventas de TV)
Probabilida
d
26. Dr. Jorge Ramírez Medina
Valor Esperado y Varianza
El valor esperado, o media, de una variable aleatoria
es una media de su localización.
La varianza resume la variabilidad en los valores de
la variable aleatoria.
La desviación estándar, , está definida como la
raíz cuadrada positiva de la varianza.
Var(x) = 2 = (x - )2f(x)
E(x) = = xf(x)
27. Dr. Jorge Ramírez Medina
Varianza y Desviación estándar
0
1
2
3
4
-1.2
-0.2
0.8
1.8
2.8
1.44
0.04
0.64
3.24
7.84
.40
.25
.20
.05
.10
.576
.010
.128
.162
.784
x - (x - )2 f(x) (x - )2f(x)
Varianza de las ventas diarias = 2 = 1.660
x
TVs
al cuadrado
Desviación estándar de las ventas diarias = 1.2884 TVs
Valor esperado y varianza
28. Dr. Jorge Ramírez Medina
Nos interesa el
contorno de la distribución
29. Dr. Jorge Ramírez Medina
Nuestro interés es el número de éxitos
que ocurren en los n intentos.
Tomamos x como el número de éxitos
que ocurren en los n intentos.
Distribución Binomial
30. Dr. Jorge Ramírez Medina
Distribución Binomial
donde:
f(x) = La probabilidad de x éxitos en n intentos
n = el número de intentos
p = la probabilidad de éxito de cualquier intento
Función de probabilidad binomial
)(
)1(
)!(!
!
)( xnx
pp
xnx
n
xf
Probabilidad de una
secuencia particular de resultados
con x éxitos en n intentos
Número de resultados
experimentales que dan
x éxitos en intentos
31. Dr. Jorge Ramírez Medina
Distribución Binomial
Ejemplo
Una empresa está preocupada por la alta rotación de
sus empleados. Para un empleado seleccionado al azar, se estima una
probabilidad de 0.1 de que la persona no esté el próximo semestre
trabajando. Si se seleccionan 3 empleados al azar ¿cuál es la
probabilidad de que uno de ellos no esté trabajando el próximo
semestre en la empresa?
32. Dr. Jorge Ramírez Medina
Distribución Binomial
Diagrama
de árbol
1st Worker 2nd Worker 3rd Worker x Prob.
Leaves
(.1)
Stays
(.9)
3
2
0
2
2
Leaves (.1)
Leaves (.1)
S (.9)
Stays (.9)
Stays (.9)
S (.9)
S (.9)
S (.9)
L (.1)
L (.1)
L (.1)
L (.1) .0010
.0090
.0090
.7290
.0090
1
1
.0810
.0810
.0810
1
33. Dr. Jorge Ramírez Medina
Distribución Binomial
Utilizando la función de probabilidad Binomial
tome: p = .10, n = 3, x = 1
)(
)1(
)!(!
!
)( xnx
pp
xnx
n
xf
243.0)81)(.1(.3)1.01(1.0
)!13(!1
!3
)1( )13(1
f
35. Dr. Jorge Ramírez Medina
Distribución Binomial
El valor esperado;
La varianza;
= 3(.1)(.9) = .27
La desviación estándar, =
Var(x) = 2 = np(1-p)
E(x) = = np
)1( pnp
= 3(.1) = .3 empleados de 3
36. Dr. Jorge Ramírez Medina
Dr Jorge Ramírez Medina
EGADE Business School
Distribución Poisson y exponencial
!
)(
x
e
xf
x
Para x ≥0, μ≥0
x
exf
1
)(
ox
exxP 1)( 0
37. Dr. Jorge Ramírez Medina
Reflexión en clase
• Cuidado con lo que asume.
• Sea claro acerca quiere descubrir.
• No tome la causalidad por sentado.
• Con estadística no se puede probar cosas con el 100% de certeza
• Un resultado que es numéricamente significativo puede ser inútil.
Tomado de The Use and Misuse of statistics HBP.