1. 34
REPUBLIVCA BOLIVARIANA DE VENEZUELA
MINISTERIO DEL PODER POPULAR PARA LA EDUCACION SUPERIOR
I.U.P.”SANTIAGO MARIÑO
SEDE BARCELONA
AULA VIRTUAL DE: ESTADISTICA I
SECCION: Y.V
MEDIDAS DE TENDENCIA
PROFESOR: ALUMNA:
Ing. Ramón A. Aray López Yoledis Medina
C.I: 25.245.448
Seccion Y.V
Barcelona, Febrero 2017
EJERCICIOS RESUELTOS
2. 35
EJERCICIO 1
Los psicólogos que trabajan en un Centro de Día para adultos de la tercera edad de la Ciudad
de Buenos Aires, observaron el estado civil de un grupo de 120 varones que se tratan por
problemas depresivos. Sus registros se presentan en la siguiente tabla:
Estado Civil Frecuencia
Soltero 24
Casado 18
Viudo 42
Divorciado 36
Total 120
¿Qué Estado Civil se le asignaría a Antonio G. si solo sabe que se trata por problemas
depresivos y concurre a dicho Centro de Día? Justifique su respuesta.
Resolución:
La moda de la distribución de la variable Estado Civil de los adultos mencionados es la
categoría VIUDO, pues a ella le corresponde la mayor frecuencia. Esta categoría es la más
probable para una observación realizada al azar. Por tanto, en las condiciones dadas, a
Antonio G. se le asignaría el estado civil VIUDO. Nótese que la categoría DIVORCIADO
también concentra una alta proporción de las frecuencias. En el ejercicio resuelto 4 se retomará
este ejercicio y se cuantificará la incertidumbre para la asignación hecha al azar.
EJERCICIO 2
Los siguientes son los puntajes de un grupo de adolescentes en un test de Agudeza Visual: 25,
12, 15, 23, 24, 39, 13, 31, 19, 16.
a) Calcule la media, la mediana, el primer cuartil, el primer intercuartil y las frecuencias de los
intercuartiles.
b) Calcule la varianza y el desvío estándar.
Resolución:
En los problemas como este en que los datos son pocos (en este caso son diez) el cálculo
puede hacerse “manualmente” (usando una calculadora). Cuando los datos no son pocos se
3. 36
emplean programas computacionales de cálculo estadístico como el Statistix. A continuación se
presentan los dos procedimientos, con calculadora o con Excel, y mediante el uso del programa
Statistix.
a) i) Usando calculadora o Excel
x
Para calcular la media ( x ) se usa la expresión: x=
n
x= 25 12 15 23 24 39 13 3119 16
217
21,710 10
Entonces: x= 21,7
Para calcular la mediana (Mdn) se deben ordenar los puntajes de forma ascendente:
12, 13, 15, 16, 19, 23, 24, 25, 31, 39
Mdn =
19 23
21, pues 19 y 23 ocupan las posiciones centrales. O sea: Mdn= 21
2
Considérense nuevamente los datos ordenados:
12, 13, 15, 16, 19, 23, 24, 25, 31, 39
En este caso de pocos datos por simple observación se obtiene el primer cuartil q1 = 15 y el
primer intercuartil es Q1 = {12,13}. Las frecuencias de los intercuartiles es igual a 2 en los
cuatro casos.
a) ii) Usando el programa Statistix
Se cargan los valores de la variable Puntaje en un archivo:
Sujeto Puntaje
1 25
2 12
3 15
4 23
5 24
6 39
7 13
8 31
9 19
10 16
4. 37
s 2 73,12
Desde el Menú, en StatisticsSummary Statistics Descriptive Statistics se pide que realice
los cálculos de interés y se obtiene lo que sigue:
Descriptive
Variable
Statistics
Mean 1st Quarti Median 3rd Quarti
Puntaje 21.700 14.500 21.000 26.500
Nótese que los cuartiles obtenidos con Statistix difieren de los calculados más arriba con el
procedimiento manual; esto se debe a que el programa usa una definición diferente para los
cuartiles.
b) i) Usando calculadora o Excel
Calculamos la suma de cuadrados (SC):
SC = x x2
SC = (25-21,7)2
+ (12-21,7)2
+ (15-21,5)2
+ (23-21,7)2
+ (24-21,7)2
+ (39-21,7)2
+
(13-21,7)2
+ (31-21,7)2
+ (19-21,7)2
+ (16-21,7)2
SC = 658,1
Luego la varianza (s2
) resulta igual a:
Luego: s2
= 73,12
De ahí obtenemos el desvío estándar (s):
s = = = 8,55, luego s = 8,55
El cálculo de la SC también podría haberse hecho usando la fórmula computatoria:
SC = x2
1
. x2
n
SC = 252
+ 122
+ 152
+ 232
+ 242
+ 392
+ 132
+ 312
+ 192
+ 162
–
1
.25 12 15 23 24 39 13 31 19 162
10
SC = 5367 -
1
.2172
=5367 – 4708,9.
10
Luego: SC = 658,1
Continuándose luego de la misma forma.
5. 38
b) ii) Usando el programa Statistix
Desde el Menú, en StatisticsSummary Statistics Descriptive Statistics se pide que realice
los cálculos de interés y se obtiene lo que sigue:
Descriptive Statistics
Variable SD Variance
Puntaje 8.5512 73.122
EJERCICIO 3
En un grupo de estudiantes se considera el número de ensayos que necesita cada uno para
memorizar una lista de seis pares de palabras. Los resultados fueron:
5 8 3 9 6 7 10 6 7 4 6 9 5 6 7 9 4 6 8 7
a) Construya la tabla de frecuencias.
b) Calcule la moda, la media, la mediana y el tercer cuartil de las observaciones dadas.
Obtenga la frecuencia del conjunto de los resultados superiores a 5.
c) Calcule la varianza y el desvío estándar.
d) Un grupo de 20 actores fue sometido a la misma experiencia que los estudiantes
mencionados arriba. Para ellos resultó una media de 4,8 y un desvío de 1,8. En base a los
resúmenes estadísticos adecuados señale:
d1) cuál es el grupo de mejor desempeño en la experiencia realizada. Justifique su respuesta.
d2) en cuál grupo los integrantes son más parecidos entre sí en relación a la cantidad de
ensayos necesarios para memorizar la lista de seis pares de palabras. Justifique su respuesta.
Resolución: a) Usando el programa Statistix se obtiene la distribución de frecuencias para el
número de ensayos.
Frequency Distribution of Número de ensayos
Cumulative
Value Freq Percent Freq Percent
3 1 5.0 1 5.0
4 2 10.0 3 15.0
5 2 10.0 5 25.0
6 5 25.0 10 50.0
7 4 20.0 14 70.0
8 2 10.0 16 80.0
9 3 15.0 19 95.0
10 1 5.0 20 100.0
Total 20 100.0
Por ejemplo, en la cuarta línea de esta tabla de frecuencia se lee que 5 de los 20 estudiantes
(25% de la muestra) realizaron 6 ensayos, y que 10 estudiantes necesitaron hacer 6 ensayos o
menos.
b) La moda es 6, pues es el valor de la variable al que le corresponde la mayor frecuencia.
x. f
Obtención de la media usando calculadora o Excel: Partiendo de la expresión
construye la siguiente tabla:
x= , se
n
6. 39
X f x.f
10 1 10
9 3 27
8 2 16
7 4 28
6 5 30
5 2 10
4 2 8
3 1 3
20 132
Resultando: x=
132
6,6. Luego:
20
x= 6,6
Cálculo de la mediana usando calculadora: Se calculan las frecuencias acumuladas llamadas
fa y ga según se muestra en la tabla que sigue:
x f fa ga
10 1 20 1
9 3 19 4
8 2 16 6
7 4 14 10
6 5 10 15
5 2 5 17
4 2 3 19
3 1 1 20
Como
n
= 10, resulta
2
Valores Altos: A = {10, 9, 8, 7} con fA= 10 = n/2
Valores Bajos: B = {6, 5, 4, 3} con fB = 10 = n/2
Como no quedan valores de la variable fuera de AB, resulta que la mediana es:
Mdn =
7 6
6,5
2
Cálculo del tercer cuartil:
Como
3n
15, resulta A = {9, 10} con fA = 4 5 = n/4
4
B = {3, 4, 5, 6, 7} con fB = 14 15 = 3n/4.
Luego: q3 = 8
7. 40
s 2
n
Estos tres últimos cálculos pueden ser realizados usando Statistix. Desde el Menú, en
StatisticsSummary Statistics Descriptive Statistics se pide que realice los cálculos de
interés y se obtiene lo que sigue:
Descriptive
Variable
Statistics
Mean 1st Quarti Median 3rd Quarti
x 6.6000 5.2500 6.5000 8.0000
Si se llama C al conjunto de los resultados superiores a 5, entonces:
C = {6, 7, 8, 9, 10} y resulta fC = 15.
Nótese que este último resultado como el de la moda se obtiene sin necesidad de cálculo
alguno, sólo con la observación de la tabla de distribución de frecuencias.
c) Para el cálculo de la varianza y del desvío estándar con calculadora o Excel puede usarse la
fórmula computatoria para la suma de cuadrados:
X f x.f x2
.f
10 1 10 100
9 3 27 243
8 2 16 128
7 4 28 196
6 5 30 180
5 2 10 50
4 2 8 32
3 1 3 9
20 132 938
SC = x 2
. f
1
. x.f 2
= 938
1
*132
2
66,8
20
Luego, la varianza y el desvío resultan:
s2
=
SC
n 1
66,8
, entonces: s2
= 3,5158 y s = = 1,875
19
El mismo cálculo puede realizarse en Statistix. A partir de los datos ya cargados para obtener la
media, se va al Menú, en StatisticsSummary Statistics Descriptive Statistics se pide que
realice los cálculos de interés y se obtiene lo que sigue:
Descriptive
Variable
Statistics
N SD Variance
X 20 1.8750 3.5158
d) d1) El grupo de actores es el que tuvo mejor desempeño en la experiencia realizada. Esta
afirmación se funda en que los actores requirieron, en promedio, una cantidad menor de
ensayos para memorizar los 6 pares de palabras que la requerida por los estudiantes,
Efectivamente, la media de los actores es 4,8 y 6,6 la media de los estudiantes.
d2) El grupo con los integrantes más parecidos en cuanto a la variable registrada, es el de
variabilidad menor. Si bien los desvíos estándar son similares, las medias no lo son. Luego,
8. 40
para comparar la variabilidad de los dos grupos en cuanto al número de ensayos necesarios
para memorizar los seis pares de palabras debemos recurrir, si es posible su uso, al
Coeficiente de Variación (CV). Notemos que tiene sentido usar el CV porque tratamos con
variables que se miden con una escala de razones.
Para los estudiantes: CV = 1,875 / 6,6 = 0,284 y para los actores: CV = 1,8 / 4,8 = 0,375
En tanto el CV para los estudiantes es menor que para los actores, puede afirmarse que los
estudiantes presentan valores de la variable más próximos a la media del grupo, y por tanto
son más parecidos entre sí, que los actores. Luego, la dispersión relativa del número de
ensayos necesarios para memorizar la lista de seis palabras es menor en el grupo de
estudiantes y este grupo resulta más homogéneo en cuanto a la característica observada.
EJERCICIO 4
La siguiente distribución de frecuencias corresponde a las observaciones del estado civil
registradas, por los psicólogos del ejercicio resuelto 1, sobre un grupo de 100 mujeres tratadas
por problemas depresivos.
Estado Civil Frecuencia
Soltera 18
Casada 10
Viuda 62
Divorciada 10
Total 100
Compare esta distribución con la de los varones dada en el ejercicio resuelto 1.
Resolución:
Para las mujeres con problemas depresivos resulta que la categoría modal es VIUDA, ya que le
corresponde la mayor frecuencia.
Como los totales de varones y mujeres son distintos, para comparar las distribuciones
consideramos la distribución de los porcentajes para cada sexo.
Estado Civil Varones % Mujeres %
Soltero 20 18
Casado 15 10
Viudo 35 62
Divorciado 30 10
Total 100 100
Para las mujeres el porcentaje mayor corresponde a la categoría VIUDA, en cambio para los
hombres hay dos categorías con porcentajes altos y similares (VIUDO y DIVORCIADO). O sea
que en las mujeres las frecuencias están concentradas en un número menor de categorías que
en los hombres. De ahí que la incertidumbre sobre el estado civil de una persona con
9. 41
problemas depresivos es menor si es mujer. Por lo tanto la distribución de mujeres tiene menor
entropía. Veamos que el valor de la Entropía (H) correspondiente confirma esta afirmación.
La expresión para el cálculo de la Entropía (H) es
H = -∑ fR.LOG10(fR), o bien H =∑ [- fR.LOG10(fR)]
Operando en Excel resulta:
Estado Civil Varones
fR
Mujeres
fR
Varones
- fR.LOG10(fR)
Mujeres
- fR.LOG10(fR)
Soltero 0,20 0,18 0,1398 0,1341
Casado 0,15 0,10 0,1236 0,1000
Viudo 0,35 0,62 0,1596 0,1287
Divorciado 0,30 0,10 0,1569 0,1000
Total 1 1 0,5798 0,4628
O sea:
Varones Mujeres
Entropía (H) 0,5798 0,4628
Resulta que, para la información muestral dada, la distribución del Estado Civil para las mujeres
presenta menor entropía que la de los Varones.
EJERCICIO 5
Los resultados de un test de aptitud tomado a un grupo de 100 personas se volcaron en la
siguiente tabla:
Intervalo Frecuencia
20,5 – 25,5 28
15,5 – 20,5 32
10,5 – 15,5 21
5,5 – 10,5 12
0,5 – 5,5 7
¿Cuál es el intervalo modal? ¿En qué intervalo se encuentra la mediana? Calcule la media, la
varianza y la desviación estándar.
Resolución: Muchas veces solo se conoce la distribución de frecuencias para los datos
agrupados en intervalos de clase. Es decir, no se conocen los valores observados de la
variable sino sólo cuántos de ellos (Frecuencia) se cuentan en cada intervalo. En estos casos
10. 42
el cálculo de los resúmenes estadístico es sólo aproximado. Este cálculo puede efectuarse
usando calculadora o Excel.
El intervalo modal es 15,5 -20,5 dado que tiene la mayor frecuencia.
Para encontrar el intervalo donde está la mediana se usa la tabla de frecuencias. Las
frecuencias acumuladas fa y ga se indican a continuación.
Intervalo Frecuencia fa ga
20,5 – 25,5 28 100 28
15,5 – 20,5 32 72 60
10,5 – 15,5 21 40 81
5,5 – 10,5 12 19 93
0,5 - 5,5 7 7 100
Como el tamaño de la muestra es en este caso n = 100, la mediana es el valor que supera a no
más de las 50 primeras observaciones y es superado por no más de las 50 restantes. Por
observación de la columna de frecuencias acumuladas fa se determina que los intervalos con
los valores bajos llegan hasta 15,5. El intervalo 15,5 - 20,5 es el primero cuya frecuencia
acumulada supera a n/2 = 50 y el intervalo anterior, 10,5 - 15,5, tiene una frecuencia
acumulada fa igual a 40, que es menor que n/2 = 50. Si se observa la columna de frecuencias
acumuladas ga se determina que el intervalo que contiene los valores altos, es 20,5 – 25,5, con
frecuencia igual a 28, menor que 50, mientras que el intervalo 15,5 - 20,5 es el primero cuya
frecuencia acumulada supera a n/2 = 50. Luego el intervalo donde está ubicada la mediana es
15,5 - 20,5.
Para calcular la media con calculadora, o bien con Excel, es necesario ordenar los datos en
una tabla en la que se Intercale una columna con la Marca de Clase. La Marca de Clase, punto
medio del intervalo, se utiliza como representante del intervalo para el cálculo de la media de
los datos agrupados.
Intervalo Marca de clase
x
Frecuencia
f x.f
20,5 – 25,5 23 28 644
15,5 – 20,5 18 32 576
10,5 – 15,5 13 21 273
5,5 – 10,5 8 12 96
0,5 – 5,5 3 7 21
100 1610
De esta manera resulta que:
Como
x. f
x= =
n
1610
16,10
100
sea x= 16,1
11. 43
Para el cálculo de la varianza y del desvío estándar se usa fórmula computatoria para la suma
de cuadrados. Para ello se construye la tabla siguiente:
Intervalo Marca de clase
x
f x.f x2
.f
20,5 - 25,5 23 28 644 14812
15,5 – 20,5 18 32 576 10368
10,5 – 15,5 13 21 273 3549
5,5 - 10,5 8 12 96 768
0,5 - 5,5 3 7 21 63
100 1610 29560
SC = x 2
. f
1
. x.f 2
=29560 -
1
(1610)2 = 3639
n 100
Luego s2
= 3639/99 = 36,7576. O sea s2
=36,7576 y s= 6,0628