3. Importancia de la medidas
descriptivas
Cuando se
requiere
proceder al
análisis de
los datos
previamente
recolectados,
• no basta con
organizar los
datos a través
de arreglos de
distribuciones de
frecuencias, ni
tampoco el
presentarlos a
través de
gráficas que
permiten ver su
comportamiento.
4. …Importancia de la medidas
descriptivas
Es necesario,
además de lo
anterior el utilizar
una serie de
medidas
descriptivas
• que ayuden a resumir
el comportamiento de
los datos bajo estudio.
Así, se puede
obtener un
conocimiento más
preciso de los
datos
• que el que se obtiene
a partir de las tablas y
gráficas.
8. Medidas de Centralización
Nos dan un
centro de la
distribución
de
frecuencias,
• es un valor que
se puede tomar
como
representativo
de todos los
datos.
9. Medidas de Centralización
Hay diferentes modos para definir el "centro"
de las observaciones en un conjunto de
datos. Por orden de importancia, son:
Media
Mediana
Moda
10. La media aritmética
La media aritmética es lo que
comúnmente llamamos promedio,
siendo precisamente esta medida la
más importante (de las medidas de
tendencia central), pues es
fundamental en el análisis
estadístico.
La formula para el calculo
de la misma se presenta a
continuación:
Esta medida se calcula al
sumar los valores de un
conjunto de datos y dividir
dicha suma entre el
número total de ellos.
11. Calculo de la media para datos no agrupados:
_
X = Xi
n
Ec. 2.1
= Xi
N
Ec. 2.2
Donde: _
X = Media o promedio muestral.
= Media o promedio poblacional.
X i = i -ésimo dato.
n = Número total de datos.
N = Número total de la población.
12. Ejemplo de la media aritmética
La Compañía Café del Noreste, embolsa
sobres de café de 100 gramos cada uno, la
directiva preocupada por la calidad, le ha
pedido al gerente de producción que
verifique el llenado de los mismos con la
cantidad especificada anteriormente, motivo
por el cual obtuvo una muestra de 10 sobres
y observo la siguiente distribución:
95, 97, 93.2, 94, 96, 98.4, 95, 96.1, 95, 96.4
Se pide calcule la media para este grupo de
datos.
13. Solución
Si aplicamos la ecuación ec. 2.1
_
X = ∑ Xi = (95 + 97 + 93.2 + 94 + 96 + 98.4 + 95 + 96.1 + 95 + 96.4)
n
10
_
X = 956.1 = 95.61 gramos por sobres.
10
Cuando el número de los datos es muy grande, el ejemplo de la
ec. 2.1 resultaría inadecuada pues el calculo sería muy tedioso,
por lo que resulta más práctico estimar dicha medida a partir de
datos agrupados.
Sin embargo, es importante aclarar que los métodos utilizados
para tal fin solo representan una aproximación (bastante
buena) del verdadero valor de las medidas calculadas (el cual
se calcularía a partir de los datos no agrupados).
14. Calculo de la media para datos agrupados:
_
X=
f i Xi
n
Ec. 2.3
=
f i Xi
N
Ec. 2.4
Donde: _
X = Media o promedio muestral.
= Media o promedio poblacional.
Xi = Punto medio de dicha clase o marca de clase.
f i = Frecuencia de la clase i-ésima
n = Número total de datos.
N = Número total de la población.
15. Ejemplo con datos
agrupados
Supóngase que se desea estimar la
media aritmética de los datos de la
tabla que muestra las calificaciones
obtenidas en un examen parcial de
cierta materia por un grupo de 28
estudiantes.6.0
8.0
6.9
5.8
4.1
8.5
7.2
6.3
4.4
7.5
5.7
8.6
7.8
5.8
4.4
8.6
9.7
8.9
7.0
7.0
7.0
6.0
6.4
5.1
4.0
2.6
2.3
1.1
16. Partiendo de dicha tabla se puede obtener un
estimado de la media de dichos datos usando
la ec. 2.3 como se muestra en la tabla
Clase
Frecuencia
(fi)
1.10 - 2.82
2.82 - 4.54
2.54 - 6.26
6.26 - 7.98
7.98 - 9.70
Punto medio
(Xi)
3
4
6
9
6
1.96
3.68
5.40
7.12
8.84
28
Obtención de la media aritmética para las
calificaciones parciales a partir de datos
agrupados
fi Xi
5.88
14.72
32.40
64.08
53.04
170.12
17. Por lo tanto, la media será:
_
X = ∑ f i Xi = 170.12 = 6.075
n
28
Si se compara este valor con la media
obtenida a partir de los datos no agrupados
que se muestran en el ejemplo de las
calificaciones, el cual es de 6.167, se
observa que la variación es de 1.5 % por lo
que la aproximación es bastante
buena, como generalmente sucede.
Es importante aclarar que si la distribución de
frecuencias se hubiese hecho sin perdida de
información la media obtenida a partir de
datos agrupados sería exacta
18. Por último, resulta interesante comentar que William J.
Stevenson señala que la media presenta ciertas propiedades
útiles e interesantes, que explican porque es la medida central
que se utiliza más ampliamente:
1.
2.
3.
La media siempre se puede calcular
para un conjunto de números.
Existe una media única para un
conjunto dado de números.
La media es sensible (o afectada) a
cada valor del conjunto. De este
modo, si cambia algún valor, la
media también cambiará.
19. 4. Si se suma una constante a cada valor
del conjunto, la media aumentará por la
misma cantidad.
De manera que si se suma una constante
de 4.5 a cada valor, la media aumentará
en 4.5.
En forma similar, el restar de cada valor
una constante, o bien, multiplicarlo o
dividirlo por la misma, hará que la media
disminuya por la misma cantidad, o resulte
multiplicada o dividida por dicha
constante.
5. La suma de desviaciones de los
números de un conjunto a partir de la
media, es cero: S(Xi - m) = 0.
20. Media ponderada.
La fórmula (ec. 2.1) para calcular la media
aritmética supone que cada observación es de igual
peso como generalmente sucede.
Sin embargo hay ocasiones en que cada
observación puede tener distinto peso por lo que el
calculo de esta nueva media ponderada deberá
considerar los diferentes pesos que tengan cada
una de las observaciones contempladas para lo
cual debe emplearse la siguiente fórmula:
21. Media ponderada = Wi X i
Wi
Donde:
Wi = es el peso de la observación i-ésima.
Xi = i-ésimo dato observado.
Ec. 2.4
22. Para ilustrar el empleo de esta fórmula
considere el siguiente ejemplo:
Ejemplo:
Un profesor ha establecido que en su
asignatura habrá tres exámenes
parciales con un valor de 25% cada
uno, que las tareas y los trabajos
tendrán un peso de 15% y que las
exposiciones de clase valdrán el
restante 10 %.
Si al finalizar el curso un alumno
obtuvo los siguientes resultados:
23. Concepto
Ponderación
72
85
91
88
92
0.25
0.25
0.25
0.15
0.10
Total
Examen No. 1
Examen No. 2
Examen No. 3
Tareas y trabajos
Exposiciones
Calificación
1.00
¿Cuál es la calificación final del alumno?
Solución:
Calif. = Media Ponderada = 72(0.25) + 85(0.25) + 91(0.25) + 88(0.15) + 92(0.10)
0.25 + 0.25 + 0.25 + 0.15 + 0.10
Calificación final = 84.4
24. La mediana
La
mediana es • la mitad de los
la medida
números tendrá
que divide
valores que son
menores a la mediana
un conjunto
y la otra mitad
ordenado
alcanzará valores
en dos
mayores que está.
grupos
iguales;
25. Calculo de la mediana para datos
no agrupados
El procedimiento para obtener la mediana es:
1.
2.
3.
Ordenar los datos.
Contar para saber si existe un número de
datos par o impar.
En caso de que se tenga un número impar
de datos, la mediana vendrá a ser el valor
intermedio. Si por el contrario, el número de
datos es par la mediana será el promedio
de los valores intermedios.
Por lo anterior se concluye que la mediana
es el elemento (n + 1/2) en un arreglo de
datos.
26. Ejemplo
Supóngase que tres alumnos
obtuvieron las siguientes
calificaciones en determinado
semestre, como se muestre en la
tabla
Alumno
No. 1
No. 2
No. 3
Calificaciones
6 9 8 7 9
10 8 6 7 8
8 9 9 10 10
Calificaciones
Arregladas
6 7 8 9 9
6 7 8 8 10
8 9 9 10 10
Mediana
8
8
9
Calificaciones obtenidas por tres diferentes alumnos en un semestre.
27. ¿Cuál sería la mediana para los
datos dados en la tabla?
Solución:
Obsérvese que son 10 datos (par),
por lo que los elementos 5 y 6 son los
valores intermedios, por lo tanto la
mediana será:
Mediana = 10.3 + 10.3 = 10.3
2
28. Calculo de la mediana para
datos agrupados
Para estimar la mediana a
partir de una distribución de
frecuencias se empleará el
ejemplo de las calificaciones
parciales cuya distribución de
frecuencias se presenta en la
tabla que a continuación se
reproduce:
29. Clase
1.10 - 2.82
2.82 - 4.54
4.54 - 6.26
6.26 - 7.98
7.98 - 9.70
Frecuencia
3
4
6
9
6
Para simplificar todo este
procedimiento Richard I. Levin
recomienda utilizar la siguiente
fórmula para determinar la mediana a
partir de datos agrupados:
30. ~
m=
(n + 1)/2 - (Fa + 1)
fm
w
+ Lm
Ec. 2.5
Donde: ~
m = Mediana muestral.
n = Número total de elementos en la distribución.
Fa = Suma de todas las frecuencias de clase hasta pero sin incluir a la clase
mediana.
fm = Frecuencia de la clase mediana.
w = Ancho del intervalo de clase.
Lm = Limite inferior del intervalo de clase mediana.
Así, para el ejemplo anterior se tiene:
~
n = 28
Fa = 13
fm = 9
w = 1.72
Lm = 6.26
m = (28 + 1)/2 - (13 + 1)
9
1.72 + 6.26
~
m=
14.5 - 14 1.72 + 6.26
9
~
m = 6.355
31. La moda
La moda es una medida de tendencia central similar a la
mediana ya que no se calcula por métodos ordinarios de
aritmética (como en el caso de la media aritmética).
La moda se puede definir como el valor que más se repite
dentro de un conjunto de datos.
En realidad la moda es una de las medidas menos utilizadas
ya que no se inclina por un análisis matemático.
Para ilustrar la obtención de la moda, se hará el siguiente
ejemplo:
32.
En una estación de aforo vehicular en
la zona centro de Cd. Valles, se
observaron la siguientes velocidades
a las que circula un vehículo, como se
muestra en la tabla
22
28
30
24
25
25
26
26
27
27
27
27
28
28
28
29
29
29
29
29
29
30
30
30
30
30
30
30
31
31
Donde se puede observar que el valor que más veces se repite es
el de 30 Km/hr, el cual constituye la moda.