2. 2
Introducción a la Estadística
• Presentación de datos y/o resumen de datos.
• Metodología para presentar datos, y para
extraer conclusiones o inferencias de los
datos
• Variables aleatorias extraidas por muestreo.
¿Qué es?
3. 3
Definiciones
Datos:
Los Datos están compuestos de objetos
que tienen variables.
Ejemplo: 6 carros en un parqueo
• Los carros son los objetos
• Variables: peso, ancho, longitud, tipo,
color, año, etc..
4. 4
Definiciones, cont.
Variable Categórica : respuesta categórica
Ejemplo: Ford, Volvo, Toyota
Variable Numérica : respuesta numérica
Ejemplo: peso del carro es 3000 lb
5. 5
Definiciones, cont.
Tipos de variable numérica:
• Discreta: se cuenta ó ‘señala’
Ejemplo: número de cilindros
• Continua: de mediciones
Ejemplo: presión de la llanta
6. 6
Definiciones, cont.
Escalas asociadas con las variables:
• Nominal: clasificadas en categorias
discretas
Ejemplo: Ford, GM, Volvo, etc.
• Ordinal: categorias que implican orden.
Ejemplo: ranking de carros por
confiabilidad en su clase.
7. 7
Definiciones, cont.
Escalas asociadas con las variables:
• Intervalo: la diferencia es sólo en
significado(mayor o menor) ºC
Ejemplo: año de manufactura puede ser
Hebreo, Islámico, o Gregoriano, pero
todos dan la misma edad.
• Ratio: tiene un punto cero ºK
Ejemplo: Espesor del vidrio del
parabrisas
8. 8
Poblaciones vs. Muestras
• Población: Conjunto de
todas mediciones de interés
para el investigador
Ejemplo: conjunto de todos
los carros registrados en
Piura
• Muestra: Subconjunto
seleccionado de una
población
Ejemplo: Un lote de todos
los carros registrados en
Piura.
Population
Sample
9. 9
Dos Metodologías Estadísticas
Estadística Descriptiva : «Asimilación", ya
sea a través de gráficos, tablas o medidas
de resumen, la información de una
población o muestra.
Estadística Inferencial : Usando
información de una muestra para estimar
o probar hipótesis sobre una población.
10. 10
Parámetros versus Estadísticos
Parámetro: Una medida resumen de una
población
Estadístico: Una medida resumen de una
muestra que pretende dar información sobre
una población.
Ejemplo: El promedio de una población es un
parámetrro, y el promedio de una muestra, si
pretende estimar el promedio de la población,
es un estadístico.
11. 11
¿Dónde ir primero?
A la Estadística Descriptiva!
Ejemplos: media, mediana, histograma,
gráfico circular, gráfico de barra, etc.
Estadística Inferencial, requiere especial
preparación en teoría de probabilidades.
12. 12
Ejemplo: una población
• Cinco
personas
viven en una
isla. La tabla
da sus
ingresos
anuales en
miles de soles
A B C D E
60.2 40.2 70.5 60.2 100.7
14. 14
Medidas de Tendencia Central y
Medidas de Dispersión (Variación)
• Las medidas de tendencia central,
muestran un punto que de alguna forma
representa el medio o centro de los datos.
• Ejemplos: media, mediana, moda
• Medidas de dispersión, muestran la
cantidad de dispersión o variación existe
en los datos
• Ejemplos: rango, desviación estándar,
varianza, coeficiente de variación.
15. 15
Media o Promedio: Población
60.2 40.2 70.5 60.2 100.7
Mean 66.36
5
+ + + +
= =
1 2 3 4 5
Mean
5
X X X X X+ + + +
=
1
N
i
i
X
N
µ =
=
∑
Xnot
sumPopulation size
Population size
Number imean
16. 16
Mediana: población
• Mediana = valor medio, o el promedio de
dos valores centrales, para datos
ordenados.
• Mediana = valor en la posición (N+1)/2
con los datos ordenados.
B D A C E
40.2 60.2 60.2 70.5 100.7
Ejemplo
Posición (5+1)/2
17. 17
Media versus mediana: Ejemplo
• A las 5 personas de la
isla se agregó una
sexta: F. Su ingreso
por año era 100,000
(en miles).
B D A C E F
40.2 60.2 60.2 70.5 100.7 100000
18. 18
Media y Mediana, Antes y
después
• La nueva mediana está en la posición (N+1)/2 = 7/2
= 3.5, o entre 60.2 y 70.5.
• La nueva mediana is 60.2 + .5(70.5 –60.2)
= 65.35
• The nueva media es
(40.2+60.2+60.2+70.5+100.7+100000)/6
= 16722 (redondeado en miles)
B D A C E F
40.2 60.2 60.2 70.5 100.7 100000
Posición 3
Posición 4
19. 19
Resumen
Antes de F Después de F
Media = 66.36 Media = 16722
Mediana = 60.2 Mediana = 65.35
• El efecto de los valores extremos sobre la
media y la mediana es distinto.
• ¿Cuál es una mejor medida?
20. 20
Moda
B D A C E
40.2 60.2 60.2 70.5 100.7
• La moda es el valor que ocurre con mayor
frecuencia. Puede haber más de una moda.
• Utilidad?
21. 21
Medidas de Dispersión: Rango
• El rango es la diferencia entre los
valores más grande y más pequeño
• Rango = Xmaximum - Xminimum
B D A C E
40.2 60.2 60.2 70.5 100.7
•Rango = 100.7 – 40.2 = 60.5
•Ejemplo
22. 22
Rango: Otro Ejemplo
University A University B
56 52
80 72
58 72
52 72
78 72
61 72
63 72
98 72
99 72
75 99
•Los salarios anuales de
dos grupos de graduados
son:
•El rango es
•99 – 52 = 47
•en cada caso.
23. 23
Rango intercuartil
• Q1 = primer cuartil, da un valor tal que
25% de las observaciones son menores
• Q1 = valor en la posición ordenada (1/4)
(N+1)
• Q3 = tercer cuartil, da un valor tal que
75% de las observaciones son menores
• Q3 = valores en la posición ordenada (3/4)
(N+1)
• Rango Intercuartil = Q3 - Q1
25. 25
Varianza y Desviación
Estandard
Varianza es el promedio la desviación de la
media al cuadrado
( )
2
2 1
variance
N
i
i
X
N
µ
σ =
−
= =
∑
( )
2
1
standarddeviation
N
i
i
X
N
µ
σ =
−
= =
∑
•“sigma”
•“sigma-squared”
27. 27
Caso Muestra
• Cuando los datos son una muestra de n
items y no una población, entonces las
fórmulas para la varianza y desviación
estandard con algo diferentes:
( )
2
1
standarddeviation estimate
1
n
i
i
X X
S
n
=
−
= =
−
∑
( )
2
2 1
varianceestimate
1
n
i
i
X X
S
n
=
−
= =
−
∑
•Sample mean
30. 30
Limitaciones de la Desviación
Estándard
Ejemplo: La desviación estándard en los
gastos anuales de 5 clientes de un
restaurante es $230.44. ¿Hay mucha
variación en su uso del restaurante?
Respuesta: depende.
31. 31
Ejemplo, continua…
Ambos grupos tienen la misma desviación
estandard. En el Grupo 1, el mayor gasto es
154% más que el menor, mientras que este
número es 13% para el Grupo 2.
Grupo 1, en $ 905 794 835 466 1163 837 457
Grupo 2, en $ 5905 5794 5835 5466 6163 5837 5457
32. 32
Coeficiente de Variación CV
El CV es la desviación estandard dividida
por la media. Aproximadamente, es el
grado de variación respecto de la media.
Puede ser un ratio o un porcentaje.
CV
σ
µ
=
34. 34
Ejemplo 2
Un empleado de oficina se quejó de que el
coeficiente de variación de temperatura en su
oficina fue de 14,9%, lo que estaba por encima
de la norma acordada por el Sindicato de 10%.
Ella presentó los siguientes datos de la semana
anterior:
Día 1 2 3 4 5
Grados
Celsius
25 20 27 21 18
( ) ( )
2 2
25 22.2 18 22.2
3.31
5
σ
− + + + −
= =
25 20 27 21 18
22.2
5
µ
+ + + +
= =
•CV = 3.31/22.2 = .149
35. 35
Ejemplo 2, continua
No tan rápido, dijo la administración. Estos son los
estándares establecidos por la empresa matriz
EEUU. Ellos vuelven a calcular el CV y da 8,3%, y
llegaron a la conclusión de que el coeficiente de
variación estaba dentro del rango permitido
Día 1 2 3 4 5
Grados Fahrenheit 77.0 68.0 80.6 69.8 64.4
( ) ( )
2 2
77.0 71.96 64.4 71.96
5.957
5
σ
− + + + −
= =
77.0 68.0 80.6 69.8 64.4
71.96
5
µ
+ + + +
= =
•CV = 5.96/71.96 = .
083
•F=9C/5+32