2. Capítulo 3 Estadísticos para Describir, Explorar y Comparar (Paginas 81-134)
3-2 Medidas de Tendencia Central
Ejercicios Paginas 94-99 Ejercicios 1,5,7,11,27,29,31,33,37
Ejercicio #1
1.- Medidas de tendencia central ¿En qué sentido la media, mediana, moda y mitad del rango son
medidas de “tendencia central”?
R= Utilizan diferentes métodos para proporcionar un valor (o valores) centrales o intermedios de un
conjunto de datos.
En los ejercicios 5 a 20, calcule a) la media, b) la mediana, c) la moda y d) la mitad del rango de los datos muestrales listados. También responda las preguntas que
se plantean.
Ejercicio #2
5.- Número de palabrasinglesas Se obtuvo una muestra aleatoria simple de páginas del diccionario
Merriam-Webster’s Collegiate Dictionary, decimoprimera edición. A continuación, se indica el número
de palabras definidas en esas páginas. Puesto que este diccionario tiene 1459 páginas con palabras
definidas, estime el número total de palabras definidas en el diccionario. ¿Es probable que se trate
de una estimación precisa del número de palabras en el idioma inglés?
51 63 36 43 34 62 73 39 53 79
R= x(media)= 53.3
mediana = 52.0
moda = no hay
mitad del rango = 56.5
Si utilizamos la media de 53.3 palabras por página, la estimación del número total de palabras es
77,765. Como la media se basa en una muestra pequeña y como parece que los números de las
palabras definidas en las páginas varían por una gran cantidad, lo más probable es que la estimación
no sea muy precisa.
Ejercicio #3
7.- Costos de choques de automóviles El Insurance Institute for Highway Safety realizó pruebas
con choques de automóviles nuevos que viajaban a 6 mi/h. Se obtuvo el costo total de los daños
para una muestra aleatoria simple de los automóviles probados, lo cual se presenta a continuación.
¿Hay una gran diferencia entre las distintas medidas de tendencia central?
$7448 $4911 $9051 $6374 $4277
R= x(media)= $6412.2
mediana = $6374.0
moda = no hay
mitad del rango = $6664.0
Las diferentes medidas de tendencia central no difieren en grandes cantidades.
Ejercicio #4
11.- Vuelos de transbordador espacial A continuación se presentan las duraciones (en horas) de
una muestra aleatoria simple de todos los vuelos (hasta el momento en que se escribió este libro)
del Space Transport System (transbordador espacial) de la NASA. Los datos corresponden al
conjunto de datos 10 del apéndice B. ¿Hay alguna duración que sea muy poco común? ¿Cómo
podría explicarse?
73 95 235 192 165 262 191 376 259 235 381 331 221 244 0
R= X(media)= 217.3 horas
mediana = 235.0 horas
moda = 235.0 horas
mitad del rango = 190.5 horas.
La duración de 0 horas es muy inusual, y podría representar un vuelo cancelado. (En realidad,
representa la duración del vuelo del Challenger que resultó en una explosión catastrófica casi
inmediatamente después del despegue).
3. Conjuntos grandes de datos del apéndice B. Para los ejercicios 25 a 28, remítase al conjunto de datos indicado del apéndice B. Con un programa de cómputo o una
calculadora, obtenga las medias y las medianas.
Ejercicio #5
27.- Voltaje de una casa Remítase al conjunto de datos 13 del apéndice B y compare las medias y
las medianas de los tres conjuntos diferentes de niveles de voltaje medidos.
R= x(media)Casa: = 123.66 volts
mediana = 123.70 volts. Gen
x(media)= 124.66 volts
mediana = 124.70 volts. UPS
x(media)= 123.59 volts
mediana = 123.70 volts
En los 3 casos su media varia por muy pocas décimas, por otro lado la medina resulta en los 3
casos igual
4. En los ejercicios 29 a 32, calcule la media de los datos que se resumen en la distribución de frecuencias indicada. Además, compare las medias calculadas con las
medias reales que se obtuvieron al utilizar la lista original de datos, que es la siguiente: (ejercicio 29) 21.1 mg; (ejercicio 30) 76.3 latidos por minuto; (ejercicio 31)
46.7 mi/h; (ejercicio 32) 1.911 lb.
Ejercicio #6
29.- x(media)= 20.9 mg.
La media de la tabla de
frecuencias se aproxima
a la media de 21.1 mg
para la lista original de
datos.
Ejercicio #7
31.- Multas por exceso de velocidad La distribución de frecuencias dada describe
la velocidad de los conductores multados por la policía de la ciudad en
Poughkeepsie. Estos conductores viajaban por una zona de Creek Road, que pasa
por la universidad del autor y tiene un límite de velocidad de 30 mi/h. ¿Qué
diferencia existe entre la media y la velocidad límite de 30 mi/h?
R= 46.8 mi/h, que es muy cercano al valor obtenido con la lista original de valores.
Las velocidades están muy por arriba del límite de 30 mi/h (probablemente porque
la policía multó solo a aquellos que viajaban muy por arriba de la velocidad límite
publicada).
Ejercicio #8
33.- Media ponderada Un alumno del autor obtuvo las siguientes calificaciones: B, C, B, A y D.
Los cursos tenían las siguientes horas de crédito: 3, 3, 4, 4 y 1. El sistema de calificación asigna
estos puntos de calidad a las calificaciones con letras: A = 4; B = 3; C = 2; D = 1; F = 0. Calcule el
promedio de las calificaciones (GPA) y redondee el resultado a dos posiciones decimales. Si la lista
del rector requiere de un promedio de 3.00 o mayor, ¿podrá ingresar este estudiante a la lista del
rector?
R= 2.93; no
Más allá de lo básico
Ejercicio #9
37.- Media recortada Ya que la media es muy sensible a los valores extremos, decimos que no es
una medida de tendencia central resistente. La media recortada es más resistente. Para calcular la
media recortada del 10% de un conjunto de datos, primero se acomodan los datos en orden, después
se elimina el 10% de los valores inferiores y el 10% de los valores superiores y luego se calcula la
media de los valores restantes. Para las calificaciones de crédito que otorga la empresa FICO,
incluidas en el conjunto de datos 24 del apéndice B, calcule lo siguiente. ¿Qué diferencias hay en
los resultados?
a) La media
R= 703.1
b) La media recortada del 10%
R= 709.7
c) La media recortada del 20%
R= 713.7
Por lo tanto los resultados no difieren de manera drástica, al parecer indican la tendencia de un
incremento en los valores conforme aumenta el porcentaje de recorte, de manera que parece que la
distribución de los datos está sesgada hacia la izquierda.
5. 3-3 Medidas de Variación
Ejercicios Páginas 109-114 Ejercicios 2, 6, 28, 32,36
Ejercicio #1
2.- ¿Enunciado correcto? En el libro How to Lie with Charts, se afirma que “la desviación estándar
suele definirse como más o menos la diferencia entre la puntuación más alta y la media, y la
puntuación más baja y la media. Por ejemplo, si la media es 1, el valor más alto es 3 y el valor más
bajo es -1, la desviación estándar es ±2”. ¿Es correcto este enunciado? ¿Por qué?
R= No, porque si aplicamos la formula “[media] ± 2(desviación estándar)” en base a los datos dado,
Obtenemos:
Media 1 Valor Min. -3
Desv. Estd 2 Valor Max. 5
En los ejercicios 5 a 20, calcule el rango, la varianza y la desviación estándar de los datos muestrales. Utilice las unidades adecuadas (por ejemplo, “minuto”) en sus
resultados. (Se usarán los mismos datos de la sección 3-2, donde se calcularon medidas de tendencia central. Aquí se calculan las medidas de variación). Asimismo,
responda las preguntas que se plantean
Ejercicio #2
6.- Pruebas de asientos de seguridad para niños La National Highway Traffic Safety
Administration realizó pruebas de choque con los asientos de seguridad para niños que se utilizan
en los automóviles. A continuación, se incluyen los resultados de esas pruebas, con las medidas
expresadas en hics (unidades estándar de lesiones de cabeza). Según los requisitos de seguridad,
la medida debe ser menor de 1000 hics. ¿Existe una gran variación en las medidas de las pruebas
de los asientos de seguridad para niños?
774 649 1210 546 431 612
R=
Datos 6 x1 X x-X (x-X)²
Rango 1149 774 611.83 162.17 26298.03
hics max. 1210 649 611.83 37.17 1381.36
hics min 61 1210 611.83 598.17 357803.36
Media (x1) 611.83 546 611.83 -65.83 4334.03
n-1 5 431 611.83 -180.83 32700.69
S² 145186.97 61 611.83 -550.83 303417.36
S1 381.03 Suma Total 725934.83
Conjuntos grandes de datos del apéndice B. Para los ejercicios 25 a 28, remítase al conjunto de datos indicado del apéndice B. Con un programa de cómputo o una
calculadora, obtenga el rango, la varianza y la desviación estándar.
Ejercicio #3
28.- Películas Remítase al conjunto de datos 9 del apéndice B y considere los montos de ganancias
de dos categorías diferentes de películas: películas con clasificación R y películas con clasificaciones
PG o PG-13. Utilice los coeficientes de variación para determinar si pareciera que las dos categorías
varían en la misma cantidad.
6. R=
Datos 3 x1 X x-X (x-X)²
Rango 112 117 74.00 43.00 1849.00
Ganan. max. 117 5 74.00 -69.00 4761.00
Ganan. min 5 100 74.00 26.00 676.00
Media (x1) 74.00 Suma Total 7286.00
n-1 2
S² 3643.00
S1 60.36
Titulo
Clasificación
de la MPA
8 millas R
Solo en la oscuridadR
Colateral R
CV1 8.16%
5
100
Clasificacion R
Ganancias en millones
(de $)
117
Datos 3 x2 X x-X (x-X)²
Rango 92 104 0.00 104.00 10816.00
Ganan. Max 104 12 0.00 12.00 144.00
Ganan. min 12 17 0.00 17.00 289.00
Media (x2) 44.33 Suma Total 11249.00
n-1 2
S² 5624.50
S2 75.00
Titulo
Clasificació
n de la MPA
La guardería de papáPG
From Justin to KellyPG
El hijo de la máscaraPG
CV2 16.92%
una variación considerablemente mayor a las ganancias de las peliculas clasificacion R
Clasificacion PG
Ganancias en millones
(de $)
104
12
17
Las Ganancias la peliculas con clasificaion PG tienen
Ejercicio #4
32.- Regla práctica de las desviaciones Utilice la regla práctica de las desviaciones para estimar
la desviación estándar de las edades de todos los profesores de su universidad.
R=
Datos 9 x X x-X (x-X)²
Rango 31 30 34.78 -4.78 22.83
Edad max. 55 24 34.78 -10.78 116.16
Edad min 24 25 34.78 -9.78 95.60
Media 34.78 27 34.78 -7.78 60.49
n-1 8 53 34.78 18.22 332.05
S² 136.94 55 34.78 20.22 408.94
S 11.70 28 34.78 -6.78 45.94
38 34.78 3.22 10.38
33 34.78 -1.78 3.16
Suma Total 1095.56
7. Ejercicio #5
36.- Teorema de Chebyshev El generador Generac del autor produce voltajes con una media de
125.0 volts y una desviación estándar de 0.3 volts. Por medio del teorema de Chebyshev, ¿qué
sabemos acerca del porcentaje de voltajes que están dentro de tres desviaciones estándar de la
media? ¿Cuáles son los voltajes mínimo y máximo que están dentro de tres desviaciones estándar
de la media?
R=
Media 125
s 0.3 1. ¿qué sabemos acerca del porcentaje de voltajes que están dentro de tres desviaciones estándar de la media?
K 3 R: Por tanto, 89 % es el porcentaje de Volts que esta dentro de 3desviaciones estándar alrededor de 125
S*K 0.9
% voltaje 88.89% 2. ¿Cuáles son los voltajes mínimo y máximo que están dentro de tres desviaciones estándar de la media?
Volt. Min 124.1 R: Al menos 89% tiene un voltaje de entre 124.1y 125.9
Volt. Max 125.9
% V =
3-4 Medidas de Posición Relativa y Gráficas de Caja
Ejercicios Páginas 126-129 Ejercicios 3, 7, 13, 29, 33,35
Ejercicio #1
3.- Gráficas de caja A continuación se presenta una gráfica de la caja, generada por STATDISK, de
las duraciones (en horas) de vuelos de naves espaciales de la NASA. ¿Qué nos indican los valores
de 0, 166, 215, 269 y 423?
R= 0 horas es la duración del vuelo más corto, el primer cuartil Q1 es 166 horas, el segundo cuartil
Q2 (o mediana) es 215 horas, el tercer cuartil Q3 es 269 horas, y el máximo es 423 horas.
Puntuaciones z En los ejercicios 5 a 14, exprese todas las puntuaciones z con dos decimales.
Ejercicio #2
7.- Puntuación z del géiser Old Faithful Las duraciones de las erupciones del géiser Old Faithful
tienen una media de 245.0 segundos y una desviación estándar de 36.4 segundos (de acuerdo con
el conjunto de datos 15 del apéndice B). Una erupción dura 110 segundos.
a) ¿Qué diferencia hay entre la duración de 110 segundos y la media?
R= 135 seco
b) ¿A cuántas desviaciones estándar corresponde [la diferencia obtenida en el inciso a)]?
R= 3.71
c) Convierta la duración de 110 segundos a una puntuación z.
R=-3.71
d) Si consideramos que las duraciones “comunes” son aquellas que corresponden a puntuaciones z
entre -2 y 2, ¿la duración de 110 segundos es común o inusual?
R= Inusual
Ejercicio #3
13.- Comparación de calificaciones de pruebas Las calificaciones en la prueba SAT tienen una
media de 1518 y una desviación estándar de 325. Las calificaciones de la prueba ACT tienen una
media de 21.1 y una desviación estándar de 4.8. ¿Cuál es relativamente mejor: una calificación de
1840 en la prueba SAT o una calificación de 26?0 en la prueba ACT? ¿Por qué?
R= La puntuación de 1840 se convierte a z = 0.99, y la puntuación de 26.0 se convierte a z = 1.02,
de manera que la puntuación de 26.0 es relativamente mejor porque tiene la puntuación z más
grande.
8. Ejercicio #4
29.- Gráfica de la caja de calificaciones FICO Se obtuvo una muestra aleatoria simple de
calificaciones de crédito otorgadas por la empresa FICO, y los datos ordenados se presentan a
continuación. Construya una gráfica de la caja que incluya los valores del resumen de los 5 números.
664 693 698 714 751 753 779 789 802 818 834 836
R=
Gráficas de caja de los conjuntos más grandes de datos del apéndice B. En los ejercicios 31 a 34, utilice los conjuntos de datos del apéndice B.
Ejercicio #5
33.- Gráficas de caja para los pesos de monedas de 25 centavos Utilice la misma escala para
construir gráficas de caja para los pesos de monedas de plata de 25 centavos anteriores a 1964 y
posteriores a 1964, a partir del conjunto de datos 20 del apéndice B. Utilice gráficas de caja para
comparar los dos conjuntos de datos.
R= Parece que los pesos de las monedas de 25 centavos acuñadas antes de 1964 son mucho más
altos que los de las monedas acuñadas después de ese año.
Más allá de lo básico
Ejercicio #6
35.- Valores atípicos y gráfica de la caja modificada Utilice las 40 longitudes del muslo (en
centímetros) de mujeres que se incluyen en el conjunto de datos 1 del apéndice B. Construya una
gráfica de caja modificada e identifique cualquier valor atípico, tal como se definió en la parte 2 de
esta sección.
R= Valores atípicos: 27.0 cm, 31.1 cm, 32.1 cm, 48.6 cm.