2. Introducción
• En todo análisis y/o interpretación se
pueden utilizar diversas medidas
descriptivas que representan las
propiedades de tendencia
central, dispersión y forma para extraer
y resumir las principales características
de los datos. Si se calculan a partir de
una muestra de datos, se les denomina
estadísticos; si se les calcula a partir de
una población se les denomina
parámetros.
3. Medidas de Tendencia Central
La mayor parte de las muestras de datos
muestran una tendencia a agruparse alrededor
de un punto "central" y por lo general es posible
elegir algún valor que describa todo un conjunto
de datos. Un valor típico descriptivo como ese
es una medida de tendencia central o "posición
centralizada". Las medidas de tendencia central
a estudiar son: media aritmética, mediana y
moda.
4. El problema
• El profesor de Estadística llevó a clase un bote de
cristal lleno de canicas, dijo que había entre 20 y 30,
y preguntó cómo podíamos averiguar cuántas
canicas había sin sacarlos del bote.
A los alumnos se nos ocurrió que
entre todos averiguásemos cuántos
boliches podía haber. Así que
preguntamos uno por uno a todos
los compañeros para que dijesen
cuántos boliches estimaban que
había en el bote.
5. La muestra
• Todas las respuestas las recogimos en una lista
numérica, obteniendo con ello una muestra
estadística:
21,25,24,29,26,24,23,25,28,29,
26,22,25,21,22,24,24,26,23,21
Esta lista corresponde a las 20 respuestas
obtenidas de todos los compañeros de clase
6. Una medida de centralización
• Razonamos que el número exacto de canicas
debería de ser un valor central en la
muestra, algunos tendrían que haberse
pasado y otros deberían de haberse quedado
cortos
7. Una medida de centralización
El alumno X propuso que ese “valor central” se
podía obtener sumando todas las respuestas y
dividiendo por el número de respuestas. A esta
medida obtenida de esa forma se le llama
MEDIA.
Media=
Media=24.4
n
xxxxx
x n2 ...431
10. La Media Aritmética
• Donde:
xi: marca de clase del intervalo i-ésimo
fi: frecuencia absoluta del intervalo i-ésimo
k: numero de intervalos
Ejemplo: Calcular la media aritmética para el peso de 40
trabajadores, según tabla adjunta.
11. La Media Aritmética
Ejm 01: Calcular la media
de una distribución
estadística que viene dada
por la siguiente tabla:
xi fi xi fi
61 5
64 18
67 42
71 27
73 8
Ejm 02: Hallar la media de
la distribución estadística
que viene dada por la
siguiente tabla:
xi fi xi fi
[10, 15) 3
[15, 20) 5
[20, 25) 7
[25, 30) 4
[30, 35) 2
12. La Media Aritmética
• Los resultados al lanzar un dado 200 veces vienen dados por
la siguiente tabla:
• Determinar a y b sabiendo que la puntuación media es 3.6.
1 2 3 4 5 6
fi a 32 35 33 b 35
xi fi xi fi
1 a
2 32
3 35
4 33
5 b
6 35
13. La Moda
Cuando hablamos de moda, por ejemplo en vestuario, se
relaciona con aquella prenda que se usa masivamente.
Entonces, se podría inferir que la moda tiene que ver con la
frecuencia con que se usa cierta prenda de vestir
• En estadística ocurre algo semejante.
• La moda es aquel dato que más se repite.
• Es decir, aquel dato que tiene mayor frecuencia.
• Puede haber más de una moda cuando dos o más
números se repiten la misma cantidad de veces y además
este es el máximo número de veces del conjunto.
• No hay moda si ningún número se repite más de una vez.
14. La Moda
1. Definición de moda: La moda es el valor o dato que tiene mayor
frecuencia absoluta, es decir, más repeticiones.
Para datos no agrupados
• Se representa por Mo.
• Se puede hallar la moda para variables cualitativas y
cuantitativas.
• Hallar la moda de la distribución:
2, 3, 3, 4, 4, 4, 5, 5 Mo= 4
• Si en un grupo hay dos o varias puntuaciones con la misma
frecuencia y esa frecuencia es la máxima, la distribución es
bimodal o multimodal, es decir, tiene varias modas.
1, 1, 1, 4, 4, 5, 5, 5, 7, 8, 9, 9, 9 Mo= 1, 5, 9
• Cuando todas las puntuaciones de un grupo tienen la misma
frecuencia, no hay moda. 2, 2, 3, 3, 6, 6, 9, 9
19. La Mediana
1. Ejm: Calcular la mediana de una distribución estadística que
viene dada por la siguientes tablas:
fi Fi
[60, 63) 5
[63, 66) 18
[66, 69) 42
[69, 72) 27
[72, 75) 8
100
xi fi Fi
2 2
3 2
4 5
5 6
6 2
8 3
20
20. La Mediana
Ejercicio 1: Calcular la mediana de las alturas de los jugadores de
un equipo de baloncesto, que vienen dadas por la tabla:
¿Qué representa la mediana?
fi Fi
[1.70, 1.75) 1 1
[1.75, 1.80) 3 4
[1.80, 1.85) 4 8
[1.85, 1.90) 8 16
[1.90, 1.95) 5 21
[1.95, 2.00) 2 23
23
21. Ejercicio de Repaso
Ejercicio de repaso: Se hace una encuesta entre 100 personas
acerca del número de horas diarias que se dedican a ver
televisión, obteniéndose la siguiente información:
Calcular la media, la mediana y la
moda. Que representa cada una de
ellas.
22. Medidas de Posición o Cuantiles
Los cuantiles son valores de la distribución que
la dividen en partes iguales, es decir, en
intervalos, que comprenden el mismo número
de valores. Los más usados son los cuartiles, los
deciles y los percentiles.
23. Cuartiles
Cuartiles
Los cuartiles son los tres valores de la variable que dividen a un
conjunto de datos ordenados en cuatro partes iguales. Q1, Q2 y Q3
determinan los valores correspondientes al 25%, al 50% y al 75% de los
datos. Q2 coincide con la mediana.
Explicación:
Número impar de datos
2, 5, 3, 6, 7, 4, 9, 11, 14
Número par de datos
2, 5, 3, 4, 6, 7, 1, 9, 11, 13
25% 25% 25% 25%
Q1 Q2 Q3
)
4
)1(3
(
)
4
)1(2
(
)
4
1
(
3
2
1
n
iónValorPosicQ
n
iónValorPosicQ
n
iónValorPosicQ
30. Percentiles
Ejm: Calcular los pertentiles 35 y 60 de la distribución de la
tabla:
fi Fi
[50, 60) 8 8
[60, 70) 10 18
[70, 80) 16 34
[80, 90) 14 48
[90, 100) 10 58
[100, 110) 5 63
[110, 120) 2 65
65
Solución:
31. Medidas de dispersión
• Una segunda propiedad que describe a
un conjunto de datos es la dispersión.
Dispersión es el grado de variación o
diseminación de los datos. Dos
conjuntos de datos pueden diferir
tanto en tendencia central como en
dispersión o dos conjuntos de datos
pueden tener las mismas medidas de
tendencia central, pero diferir mucho
en términos de dispersión..
32. Que significa?
Aquí tenemos 9 rectángulos cuya altura es de 8
centímetros (y todos tienen la misma base).
¿Existe alguna variación respecto de su altura entre estos
rectángulos?
¿Cuál es el promedio de la altura de estos rectángulos?
8 cms.
8 + 8 + 8 + 8 + 8 + 8 + 8 + 8 + 8
9
=
72
9
= 8
33. Que significa?
Aquí tenemos 9 rectángulos cuya altura es de 8 centímetros (y
todos tienen la misma base).
El quinto rectángulo y el octavo rectángulo cambiaron su altura. El quinto
rectángulo, ahora de color rojo, mide 10 centímetros, y el octavo rectángulo,
de color cafe, mide 6 centímetros?
¿Cuál es el nuevo promedio de estos 9 rectángulos?
8 + 8 + 8 + 8 + 10 + 8 + 8 + 6 + 8
9
=
72
9
= 8
8 cms.
10 cms
6 cms
... ¡el mismo promedio! Pero... ¿ha habido variación?
34. Ilustración
Se tiene las medidas de alturas de 5 perros en milímetros.
Las alturas a sus lomos son: 600mm, 470mm, 170mm, 430mm y 300mm.
36. Rango
fi Fi
[60, 70) 10 18
[70, 80) 16 34
[80, 90) 14 48
[90, 100) 10 58
[100, 110) 5 63
El rango mide "la dispersión total“ del conjunto
de datos. Aunque el rango es una medida de
dispersión simple y que se calcula con facilidad,
su debilidad preponderante es que no toma en
consideración la forma en que se distribuyen los
datos entre los valores más pequeños y los más
grandes.
40. Desviación Estándar
Obs: esta regla es aplicable
a muestras o poblaciones
simétricas, es decir que
representan una campana
de Gauss.
41. Desviación Estándar
Regla empírica, para distribuciones simétricas o muestras o poblaciones normales.
• Aproximadamente 68% de los valores de la población cae dentro de ±1 desviación
estándar a partir de la media.
• Aproximadamente 95% de los valores estará dentro de ±2 desviaciones estándar a
partir de la media.
• Aproximadamente 99% de los valores estará en el intervalo que va desde 3
desviaciones estándar a la izquierda de la media hasta 3 desviaciones estándar a la
derecha de la media
42. Ejemplo ilustrativo
En un intento de estimar la demanda potencial futura, la National Motor Company realizó
un estudio, en el 2011, en el que preguntaba a parejas casadas cuántos automóviles debe
tener la familia promedio actual. Para cada pareja, promediaron las repuestas del hombre
y la mujer, a fin de obtener la respuesta global de la pareja. Las respuestas se colocaron
en una tabla:
a) Calcule la varianza y la desviación estándar.
b) Dado que la distribución tiene, casi, forma de campana, en teoría, ¿cuántas
observaciones deben caer entre 0.5 y 1.5? ¿Entre 0 y 2? ¿Cuántas caen de hecho en
esos intervalos?. Verifique si el 68% de los datos esta entre ±1 desviación estándar.
Nro. de autos Frecuencia
0 2
0.5 14
1 23
1.5 1.7
2 1.4
2.5 1.2
TOTAL
Solución:
44. 8 min.
10 min.
6 min.
4 min.
8 min. 8 min. 8 min.
7 min.
8 min.
Media
7,44
0,56
-3,44
0,56 0,56 2,56 0,56 -0,44 -1,44
0,56
8 + 4 + 8 + 8 + 10 + 8 + 7 + 6 + 8
9
= 7,44
0,562 + (-3,44)2 + 0,562 + 0,562 + 2,562 + 0,562 + (-0,44)2 + (-1,44)2 + 0,562
9
22,2224
9
=
Lo que significa que, en promedio,
los tiempos se desviaron más o
menos (más arriba o más abajo)
en 1,57 centímetros.
46. Ejemplo
• Para utilizar la fórmula anterior en un ejemplo, podemos suponer que
cada día el técnico A del laboratorio realiza un promedio de 40 análisis
con una desviación estándar de 5. El técnico B efectúa un promedio de
160 análisis diarios con una desviación estándar de 15. ¿Cuál de los
dos técnicos muestra menos variabilidad?
47. Ejercicio propuesto
• Talent, Ltd., una compañía en Hollywood de selección de
elenco, está en proceso de elegir un grupo de extras para una
película. Las edades de los 20 hombres que se entrevistaron
primero son:
50 56 55 49 52 57 56 57 56 59
54 55 61 60 51 59 62 52 54 49
• Calcular los estadísticos de dispersión vistos anteriormente
• El director de la película con sus conocimientos de estadística,
decide aceptar a los hombres cuyas edades estén entre los
límites de variación estándar. ¿Cuántos hombre califican como
extras?
48. Ejercicios con Excel
A continuación damos el peso en libras de una población completa de 100
jugadores de fútbol americano de la NFL.
226 198 210 233 222 175 215 191 201 175
264 204 193 244 180 185 190 216 178 190
174 183 201 238 232 257 236 222 213 207
233 205 180 267 236 186 192 245 218 193
189 180 175 184 234 234 180 252 201 187
155 175 196 172 248 198 226 185 180 175
217 190 212 198 212 228 184 219 196 212
220 213 191 170 258 192 194 180 243 230
180 135 243 180 209 202 242 259 238 227
207 218 230 224 228 188 210 205 197 169
Realizar el cálculo de todos los temas tratados hasta el momento.