Este documento presenta 5 problemas de estadística resueltos por estudiantes de ingeniería ambiental. El primer problema analiza datos sobre precios de hospedaje en Cuzco, incluyendo cálculos de medidas centrales, coeficientes de variación y porcentajes. El segundo problema compara las estructuras de precios de dos residencias de ancianos. El tercer problema compara las rentas de dos regiones. El cuarto problema identifica el nivel de renta de la mayoría en una región. El quinto problema analiza tasas de mortalidad materna en áreas de
1. UNIVERSIDAD NACIONAL DE INGENIERIA
FACULTAD DE INGENIERÍAAMBIENTAL
TRABAJO 2
“Problemas de Medidas de Resumen y Tasas”
Curso y Código:
Bioestadística AA - 232
Docente:
MSc. Beatriz Castañeda Saldaña
Integrantes:
PERALTA HUASASQUICHE, María Carolina
RODRÍGUEZ TUESTA, Carlos Gerardo
URETA MEDINA, Cristhian Eutemio
10 de Abril
Lima – Perú
2017
2. PROBLEMA1:
La oficina de turismo de la municipalidad del Cuzco ofrece la siguiente información acerca
de los precios de hospedajes en los diferentes hoteles y hospedajes de la ciudad:
Distribución simétrica aproximadamente normal con:
Media = S/. 95, Desv. estándar = S/. 20
a) Interprete cada una de las medidas e indique el valor de la moda y la mediana.
b) Obtenga los coeficientes de variación y de asimetría. Interprete.
c) De manera aproximada indique el porcentaje de hoteles y hospedajes en los cuales
el precio de hospedaje estaría entre S/. 55 y S/.115
Solución:
a) Como tenemos el dato de que la distribución es simétrica normal por aproximación,
podemos decir teóricamente que las unidades de Medidas de Posición (media, mediana y
moda) representan un equilibrio, en otras palabras, son unidades homogéneas.
𝑀𝑒 = 𝑥̅ = 𝑀𝑜
Por lo tanto
𝑀𝑜 = S/. 95 y 𝑀𝑒 = S/.95
Para las distribuciones simétricas aproximadamente normales, las medidas de media,
mediana y moda son aproximadamente iguales y forman una curva simétrica, asintótica
hacia el eje horizontal, conocida mayormente como la Campana de Gauss.
b) Coeficientes de Variación y Asimetría:
Coeficiente de Variación
Denotado por: 𝐶𝑉 =
S
𝑥̅
× 100%
𝐶𝑉 =
20
95
× 100%
𝐶𝑉 = 21.05%
Nos indica que existe un 21.05% o 0.21 de dispersión con respecto a la media (𝑥̅ = S/. 95)
Coeficiente de Asimetría
Denotado por: 𝑆 𝑘𝑝 =
3(𝑥̅− 𝑀𝑒)
S
Como la 𝑀𝑒 𝑦 𝑙𝑎 𝑥̅ son aproximadamente iguales, entonces
3. 𝑆 𝑘𝑝 = 0, ya que la distribución es simétrica normal
c) De acuerdo a la distribución simétrica normal graficada en la campana de Gauss, por
teoría:
En un intervalo desde [ 𝑥̅ − 𝑆, 𝑥̅ + 𝑆] existe un porcentaje aproximado de 68% de hoteles y
hospedajes en la ciudad de Cuzco.
En un intervalo desde [ 𝑥̅ − 2𝑆, 𝑥̅ + 2𝑆] existe un porcentaje aproximado de 95% de hoteles
y hospedajes en la ciudad de Cuzco.
Para:
Intervalo 1: [ 𝑥̅ − 𝑆, 𝑥̅ + 𝑆] = [95 − 20 , 95 + 20] = [75 , 𝟏𝟏𝟓]
Intervalo 2: [ 𝑥̅ − 2𝑆, 𝑥̅ + 2𝑆] = [95 − 40 , 95 + 40] = [ 𝟓𝟓 ,135]
75 115
13555
6813.5 13.5
Por lo tanto, desde un intervalo de precios de hoteles y
hospedajes en Cuzco desde 55 hasta 115 soles
podemos decir que existe un porcentaje aproximado de
13.5% + 68% = 81.5%
4. PROBLEMA2:
Una residencia de ancianos tiene 5 tipos de habitaciones, cuyos precios, así como los
ingresos obtenidos, son los siguientes:
Precio por habitación 200 500 750 1000 1300
Ingresos 16000 20000 37500 30000 26000
a) Calcule razonadamente el precio medio y su representatividad.
b) Si el coeficiente de variación de los precios de otra residencia es 0,75 ¿Cuál de las
dos residencias presenta una estructura de precios más homogénea? ¿Por qué?
Solución:
a) Tabulando la data facilitada en el problema:
Precio por habitación
(P/h = xi) Ingresos (ni) Xi.ni Cantidad de ancianos
Habitación 1 S/. 200.00 S/. 16,000.00 S/. 3,200,000.00 80
Habitación 2 S/. 500.00 S/. 20,000.00 S/. 10,000,000.00 40
Habitación 3 S/. 750.00 S/. 37,500.00 S/. 28,125,000.00 50
Habitación 4 S/. 1,000.00 S/. 30,000.00 S/. 30,000,000.00 30
Habitación 5 S/. 1,300.00 S/. 26,000.00 S/. 33,800,000.00 20
Total S/. 3,750.00
n = S/.
129,500.00
∑ 𝐗𝐢. 𝐧𝐢 = S/.
105,125,000.00 220
Ahora, para calcular el costo del Precio Medio de los 5 tipos de habitaciones se formulará
de la siguiente manera:
Donde 𝑥̅ representará el Precio Medio por Habitación.
𝑥̅ = ∑
𝐗𝐢. 𝐧𝐢
𝑛
𝑥̅ = ∑
105,125,000
129,500
𝑥̅ = S/.811.78 (P. Medio/H)
Distribución de la cantidad de ancianos respecto al precio por habitación:
5. b) Calcularemos el Coeficiente de Variación (CV) de la residencia en el caso mostrado.
Se hallará como: 𝐶𝑉 =
S
𝑥̅
× 100%, en base a la desviación típica y el precio medio/hab.
Para ello se determinará la “S” (Desviación típica o estándar) bajo lo siguiente.
Precio por habitación
(P/h = xi) (xi - 𝐱̅) (xi - 𝐱̅)² (xi - 𝐱̅)²*ni
Habitación 1 S/. 200.00 -S/.611.78 374,269.95 29,941,595.98
Habitación 2 S/. 500.00 -S/.311.78 97,204.31 3,888,172.51
Habitación 3 S/. 750.00 -S/.61.78 3,816.28 190,814.09
Habitación 4 S/. 1,000.00 S/.188.22 35,428.25 1,062,847.53
Habitación 5 S/. 1,300.00 S/.488.22 238,362.61 4,767,252.28
Total S/. 3,750.00 39,850,682.38
𝑆2 = ∑
(𝐱𝐢 − 𝐱̅)² ∗ 𝐧𝐢
n − 1
𝑆2 =
39,850,682.38
129500 − 1
𝑆2 = 181966.59
Por lo tanto 𝑆 = 426.58
Teniendo el dato 𝑥̅ = S/. 811.78
Entonces:
0
10
20
30
40
50
60
70
80
90
20
30
40
50
80
6. 𝐶𝑉 =
426.58
811.78
𝐶𝑉 = 53% ó 𝐶𝑉 = 0.53
Siendo el CV de la otra residencia de 0.75, se deduce que:
En comparación con la otra residencia; podemos concluir que la residencia analizada es
más homogénea. Debido a que el coeficiente de variación es menor (0.53<0.75).Esto quiere
decir que la desviación estándar es pequeña en relación con la otra, ya que una desviación
estándar pequeña indica que los datos están cerca de la media.
7. PROBLEMA3:
De dos regiones con la misma población, de un determinado país, se han tomado sendas
muestras sobre las rentas percibidas. La información recogida es la siguiente:
REGION I REGION II
Renta (en
miles)
Nº de familias
Renta (en
miles)
Nº de familias
[10 – 20) 24 [5 – 15) 10
[20 – 30) 36 [15 – 25) 42
[30 – 40) 20 [25 – 55) 35
[40 – 50) 20 [55 – 75) 20
[50 – 100) 50 [75 – 95) 13
a) Halle la renta media de las muestras de cada región y del conjunto de las dos
regiones. ¿Cuál de las dos rentas medias es más representativa?
b) ¿Es posible decir si una región posee un nivel de vida superior a la otra, si
medimos este nivel a través de la renta?
c) ¿Cuál es el nivel de renta percibido por un mayor número de familias en la
Región I?
d) Si en la Región II clasificamos a una familia en el grupo en donde se encuentra
el 50% de las menos favorecidas. ¿cuál sería el tope de renta que podría
recibir?
Solución:
a) Calculando las rentas medias y la varianza para cada región y en conjunto también:
Renta para la Región 1:
Renta (en miles) Nº de familias (ni) Marca de Clase (xi) ni x xi
[10 – 20) 24 15 360
[20 – 30) 36 25 900
[30 – 40) 20 35 700
[40 – 50) 20 45 900
[50 – 100) 50 75 3750
n = 150 ∑ 𝐗𝐢. 𝐧𝐢 = 6610
𝑥̅1 = ∑
𝐗𝐢. 𝐧𝐢
𝑛
𝑥̅1 =
6610
150
𝑥̅1 = 44.07
8. Varianza para la Región 1:
Renta (en miles) (xi-x1) (xi-x1)² (xi-x1)²ni
[10 – 20) -29.07 844.87 20276.91
[20 – 30) -19.07 363.54 13087.36
[30 – 40) -9.07 82.20 1644.09
[40 – 50) 0.93 0.87 17.42
[50 – 100) 30.93 956.87 47843.56
82869.33
Cálculo de la Varianza para la R1:
𝑆2 = ∑
(𝐱𝐢 − 𝐱̅)² ∗ 𝐧𝐢
n − 1
𝑆2 = ∑
82869.33
150 − 1
𝑆2 = 556.17
Renta para la Región 2:
Renta (en miles) Nº de familias (ni) Marca de Clase (xi) ni x xi
[5 – 15) 10 10 100
[15 – 25) 42 20 840
[25 – 55) 35 40 1400
[55 – 75) 20 65 1300
[75 – 95) 13 85 1105
n = 120 ∑ 𝐗𝐢. 𝐧𝐢 = 4745
𝑥̅2 = ∑
𝐗𝐢. 𝐧𝐢
𝑛
𝑥̅2 =
4745
120
𝑥̅2 = 39.54
Varianza para la Región 2:
Renta (en miles) (xi-x1) (xi-x1)² (xi-x1)²ni
[5 – 15) -29.54 872.71 8727.10
9. [15 – 25) -19.54 381.88 16038.82
[25 – 55) 0.46 0.21 7.35
[55 – 75) 25.46 648.13 12962.53
[75 – 95) 45.46 2066.46 26863.98
64599.79
Cálculo de la Varianza para la R2:
𝑆2 = ∑
(𝐱𝐢 − 𝐱̅)² ∗ 𝐧𝐢
n − 1
𝑆2 = ∑
64599.79
120 − 1
𝑆2 = 542.86
Para las regiones conjuntas:
𝑥̅ 𝑀 = ∑
𝐗𝐢. 𝐧𝐢
𝑛
𝑥̅ 𝑀 =
6610 + 4745
150 + 120
𝑥̅ 𝑀 = 42.06
Sabiendo estos datos, podremos saber cuál es la más representativa, por lo tanto, la
Región 2 es la más representativa debido a que su varianza es menor (542.86<556.17).
Recordar que cuanto menor es la varianza, los datos están más cercanos a la media.
b) En términos teóricos existen tres factores que condicionan la calidad de vida: esperanza
de vida, educación en todos los niveles y el PBI per-cápita. Por lo cual, la renta sola es
un factor insuficiente.
c) En el gráfico observamos que en el intervalo de 20 a 30 existe mayor número de familias.
Para el intervalo de 50 a 100 se tuvo que reducir la altura para que coincida con el área
distribuida, como lo hicimos para cada intervalo respectivo.
10. d) La pregunta hace referencia a la mediana ya que esta divide los datos en 2 partes
iguales, es decir, el tope del 50%. En este caso la mediana es 31.86 miles de soles.
Renta (en miles) Nº de familias (ni) Ni
[5 – 15) 10 10
[15 – 25) 42 52
[25 – 55) 35 87
[55 – 75) 20 107
[75 – 95) 13 120
120
Cálculo de la Mediana: 𝑀𝑒 = 31.86
11. PROBLEMA5:
Analice e interprete la siguiente información referente a la tasa de mortalidad materna, que
expresa el nº de defunciones de mujeres debido a complicaciones durante el embarazo o
parto, en determinado o año. Como tal mide las defunciones de mujeres madres por cada
100000 nacidos vivos.
12. Solución:
Área
Mortalidad Materna por 100 mil
hnv
Perú 265
Lima Metropolitana 308
Resto Urbano 213
Rural 292
Gráficamente
Por lo tanto, podemos realizar el siguiente análisis:
El gráfico de barras nos muestraque, en el año 1996, Lima Metropolitana registra un mayor
porcentaje de muerte de madres al momento de dar a luz, con respecto a otros centros
urbanos y rurales del Perú. Una de las posibles causas es porque Lima Metropolitana
representa uno de los mayores conglomerados poblacionales a nivel latinoamericano;
debido a que la migración andina se intensificó desde la década de los 50. En las zonas
rurales también existe un mayor porcentaje con respecto al resto urbano por la falta de
atención médica.
Asimismo también podemos deducir que el mayor porcentaje de muerte en madres
respecto a la edad de éstas sugiere una condición determinante, dado que mientras
0
50
100
150
200
250
300
350
Perú Lima
Metropolitana
Resto Urbano Rural