Estructura y elaboración de un presupuesto financiero
Pie
1. 1
UNIVERSIDAD NACIONAL DEL CALLAO
VICERECTORADO DE INVESTIGACIÓN
FACULTAD DECIENCIAS ECONÓMICAS
TEXTODEPROBLEMASDE
INFERENCIAESTADÍSTICA
AUTOR:
JUANFRANCISCOBAZÁNBACA
(Resolución Rectoral 940-2011-R del 22-9-11)
01-09-11 al 31-08-13
CALLAO – PERÚ
2013
2. 2
ÍNDICE
Pág.
INDICE 2
INTRODUCCIÓN 5
Capítulo 1. LA DISTRIBUCIÓN NORMAL Y EL TEOREMA DEL LÍMITE
CENTRAL 6
1.1 Distribución normal 6
1.2 Distribución normal estándar 7
1.3 Propiedad reproductiva de la distribución normal 9
1.4 Teorema del límite central 10
1.5 Ejercicios resueltos 13
1.6 Ejercicios propuestos 29
Capítulo 2. DISTRIBUCIONES MUESTRALES 33
2.1 Distribución muestral de la media 37
2.2 Distribución muestral del total (conocida la media) 39
2.3 Distribución de la diferencia de medias muestrales 40
2.4 Distribución muestral de la proporción 43
2.5 Distribución muestral del total (conocida la proporción) 47
2.6 Distribución muestral de la diferencia de proporciones 48
2.7 Ejercicios resueltos 52
2.8 Ejercicios propuestos 73
Capítulo 3. DISTRIBUCIONES ESPECIALES 77
3.1 Distribución Chi-cuadrado 77
3.2 Distribución t de student 86
3.3 Distribución muestral de la media (n < 30) 92
3.4 Distribución de la diferencia de medias muestrales con varianzas
desconocidas pero iguales 93
3.5 Distribución F de Snedecor 94
3.6 Distribución de la razón de dos varianzas muestrales 98
3.7 Ejercicios resueltos 100
3. 3
3.8 Ejercicios propuestos 119
Capítulo 4. ESTIMACIÓN PUNTUAL 122
4.1 Estimadores. Propiedades 123
4.2 Métodos de Estimación Puntual 130
4.3 Método de Máxima Verosimilitud 130
4.4 Método de los Momentos 132
4.5 Método de los mínimos cuadrados 133
4.6 Ejercicios resueltos 135
4.7 Ejercicios propuestos 152
Capítulo 5. ESTIMACIÓN POR INTERVALOS DE CONFIANZA 155
5.1 Intervalo de confianza para la media y tamaño de muestra 160
5.2 Intervalo de confianza para el total (conocida la media) 162
5.3 Intervalo de confianza para la proporción y tamaño de muestra 164
5.4 Intervalo de confianza para el total (conocida la proporción) 167
5.5 Intervalo de confianza para la diferencia de medias 168
5.6 Intervalo de confianza para la diferencia de proporciones 170
5.7 Intervalo de confianza para la media (n < 30) 173
5.8 Intervalo de confianza para la varianza 175
5.9 Intervalo de confianza para la razón de varianzas 177
5.10 Intervalo de confianza para la diferencia de medias (n y m <30) 179
5.11 Ejercicios resueltos 187
5.12 Ejercicios propuestos 235
Capítulo 6. CONTRASTE DE HIPÓTESIS ESTADÍSTICAS PARAMÉTRICAS 245
6.1 Prueba de hipótesis para la media (con varianza conocida) 251
6.2 Prueba de hipótesis para la media (con varianza desconocida) 258
6.3 Prueba de hipótesis acerca de una varianza 263
6.4 Prueba de hipótesis para la razón de varianzas 270
6.5 Prueba de hipótesis acerca de dos medias (varianzas conocidas) 276
6.6 Prueba de hipótesis acerca de dos medias (varianzas desconocidas) 281
6.7 Prueba de hipótesis para la proporción 290
4. 4
6.8 Prueba de hipótesis para la diferencia de proporciones 293
6.9 Ejercicios resueltos 299
6.10 Ejercicios propuestos 348
Capítulo 7. PRUEBA DE HIPÓTESIS NO PARAMÉTRICAS 355
7.1 Uso de la distribución Chi-cuadrado. Test de independencia 356
7.2 Test de bondad de ajuste 362
7.3 Test de Wilcoxon 364
7.4 Test de signos 367
7.5 Test de la mediana 374
7.6 Ejercicios resueltos 379
7.7 Ejercicios propuestos 395
REFERENCIAS BIBLIOGRÁFICAS 398
Apéndice 400
Tabla 1. Distribción acumulativa normal estándar 401
Tabla 2. Distribución acumulativa chi-cuadrado 403
Tabla 3. Distribución acumulativa T de student 407
Tabla 4. Distribución acumulativa F 408
Tabla 5. De Wilcoxon para n ≤ 40 y = 0.05 o 0.01 409
Tabla 6. Valores críticos para la prueba del signo S 409
5. 5
INTRODUCCIÓN
La ciencia económica para poder realizar las mediciones económicas recurre
permanentemente a la inferencia estadística, ya que las deducciones y conjeturas
económicas acerca de los parámetros están basadas en muestras aleatorias tratadas
por esta disciplina.
Con el propósito de poder contribuir al proceso de enseñanza aprendizaje de la
estadística para economistas en la Universidad Nacional del Callao (UNAC),
hemos creído conveniente elaborar un “Texto de problemas de inferencia
estadística” que de manera sencilla ayude a estudiantes de la especialidad a
desarrollar competencias conceptuales y procedimentales, mediante la asimilación
de la terminología propia de la estadística, así como las correspondientes
aplicaciones a la economía.
El texto consta de siete capítulos. En el primero, se desarrolla la distribución
normal y el teorema del límite central; el capítulo dos, presenta las distribuciones
muestrales para muestras grandes (n ≥ 30) y en el capítulo tres, se desarrollan las
distribuciones muestrales especiales ligadas a muestras pequeñas (n < 30) como la
chi-cuadrado, t de student y F.
En los capítulos cuatro y cinco se desarrollan los temas relacionados a la
estimación puntual y la estimación por intervalos de confianza respectivamente.
En el capítulo seis, se desarrollan los contrastes de hipótesis estadísticas
paramétricas, poniendo especial énfasis en la determinación del valor-P
(probabilidad mínima para rechazar la hipótesis nula) usado en los cálculos
computacionales modernos. Finalmente, en el capítulo siete se presentan las
pruebas de hipótesis no paramétricas.
Gratitud eterna a nuestra querida UNAC, por el continuo apoyo ofrecido para
alcanzar estos logros que permiten sistematizar conocimientos e incorporar temas
para la discusión en clases. El reconocimiento especial a los estudiantes de
economía de la FCE-UNAC, ya que gracias a su esfuerzo y comprensión en los
últimos años se han puesto en práctica los resultados de este modesto trabajo.
6. 6
Capítulo 1. LA DISTRIBUCIÓN NORMAL Y EL TEOREMA
CENTRAL DEL LÍMITE
“Sólo cabe progresar cuando se piensa en grande, sólo es posible avanzar
cuando se mira lejos”. José Ortega y Gasset
CONTENIDO
1.1 Distribución normal.
1.2 Distribución normal estándar.
1.3 Propiedad reproductiva de la distribución normal.
1.4 Teorema del límite central.
1.5 Ejercicios resueltos.
1.6 Ejercicios propuestos.
1.1 DISTRIBUCIÓN NORMAL
La teoría de probabilidades nos ofrece la distribución normal como una de las
distribuciones más importantes, junto al teorema central del límite, con múltiples
aplicaciones para la inferencia estadística, sobre todo en lo concerniente a las
distribuciones muestrales. Por ello a continuación hacemos un breve repaso de la
distribución normal y la presentación del teorema central del límite.
Definición.- una variable aleatoria continua X tiene distribución normal con media
μ y varianza σ2
, si su función de densidad de probabilidad esta dada por:
2
2
( )
2
2
1
( )
2
X
f x e
- ∞ < x < ∞
donde: π = 3.14159265.... y e = 2.71828184 (la base de los logaritmos
neperianos).
Notación.- una notación muy común para la distribución normal es: X ~ N(μ , σ2
)
Que se lee “la variable aleatoria X se distribuye normalmente con media μ y
varianza σ2
”.
Características geométricas.-
La gráfica tiene forma acampanada, con centro en μ.
7. 7
Es una función creciente en el intervalo (- ∞ , μ).
Es una función decreciente en el intervalo (μ , ∞).
Tiene sus puntos de inflexión en μ – σ y μ + σ.
Características estadísticas.-
Media: E (X) = μ
Varianza: V (X) = σ2
Si X ~ N(μ , σ2
). Entonces, la variable aleatoria Y = a + b X también se
distribuye normalmente con media: E(Y) = a + bμ y varianza: V(Y) = b2
σ2
. Es decir: Y ~ N(a + bμ , b2
σ2
)
Si X ~ N(μ , σ2
) el cálculo de probabilidades se efectúa realizando el
proceso de estandarización siguiente:
Z = (X - μ ) / σ ~ N(0, 1) y decimos que la v.a. Z tiene distribución
normal estándar.
1.2 DISTRIBUCIÓN NORMAL ESTÁNDAR
Definición.- Se dice que una variable aleatoria Z, es una variable aleatoria normal
estándar, si tiene distribución normal con media cero (μ = 0) y varianza uno (σ2
=
1) y su función de densidad de probabilidades es:
2/2
2
1
)( z
ezf
- ∞ < z < ∞
La función de distribución acumulativa de Z se denota por Φ (z) o F(z) y se calcula
así:
0
5
10
15
20
25
30
35
40
μ - 3σ μ - 2σ μ - σ μ μ + σ μ + 2σ μ + 3σ
X
DISTRIBUCIÓN NORMAL
8. 8
Φ (z) = F(z) = P [Z z] =
z
t
dte 2/2
2
1
Esta probabilidad nos da el área bajo la curva normal desde - ∞ hasta el valor z.
Entonces, conocidos los valores de la media μ y la varianza σ2
de una variable aleatoria
X ~ N(μ , σ2
) utilizando el proceso de estandarización Z = (X - μ ) / σ , se puede
efectuar el cálculo de probabilidades tales como:
P[a X b] = P[ (a - μ ) / σ (X - μ ) / σ (b - μ ) / σ ]
= P[ (a - μ ) / σ Z (b - μ ) / σ ]
= Φ [(b - μ ) / σ ] - Φ [(a - μ ) / σ ]
P[X a] = P[(X - μ ) / σ (a - μ ) / σ ] = P[Z (a - μ ) / σ ] = Φ [(a - μ ) / σ ]
P[X > a] = 1 – P[X a] = 1 - Φ [(a - μ ) / σ ]
Los valores de la función de distribución acumulativa normal estándar, Φ (z) o F(z),
han sido reproducidos en la Tabla 1 del Anexo utilizando la hoja de cálculo Excel.
Uso de la Tabla de la distribución normal estándar
a) Para calcular probabilidades.- en la tabla 1, conocido el valor de z, hallar Φ
(z) = F(z) = P [Z z]. Por ejemplo, para z = 1.96, tenemos que:
Φ (1.96) = F (1.96) = P [Z 1.96] = 0.97500.
b) Para hallar valores de z.- es un proceso inverso al anterior, ya que conocida la
probabilidad Φ (z) = F (z) = P [Z z] = α , en la tabla 1, se debe hallar el valor
de z que acumule en probabilidad α y que denotaremos como z = Zα .
Para el mismo ejemplo, sí Φ (z) = F (z) = P [Z z] = 0.97500, esto implica
que, en la tabla 1, a la probabilidad 0.97500, le corresponde z = Z0.97500 1.96 .
Una característica importante de la distribución normal es que:
Entre μ – σ y μ + σ se encuentra el 68.27% de las observaciones. Es decir que :
P(μ – σ X μ + σ) =
11 ZP
X
P
= Φ (1) - Φ (-1) = 0.84134 –0.15866 = 0.68268
9. 9
Entre μ – 2σ y μ + 2σ se encuentra el 95.45% de las observaciones, puesto que:
P(μ – 2σ X μ + 2σ) =
22
22
ZPZP
= Φ (2) - Φ (-2) = 0.97725 –0.02275 = 0.9545
Entre μ – 3σ y μ + 3σ se encuentra el 99.73% de las observaciones. Es decir que:
P(μ – 3σ X μ + 3σ) =
33
33
ZPZP
= Φ (3) - Φ (-3) = 0.99865 – 0.00135 = 0.9973
Entre μ – 4σ y μ + 4σ se encuentra el 99.9937% de las observaciones. Es decir
que:
P(μ – 4σ X μ + 4σ) =
4 4
4 4P Z P Z
= Φ (4) - Φ (-4) = 0.999968 – 0.000031 = 0.999937
Entre μ – 5σ y μ + 5σ se encuentra el 99.999942% de las observaciones. Es decir
que:
P(μ – 5σ X μ + 5σ) =
5 5
5 5P Z P Z
= Φ (5) - Φ (-5) = 0.99999971 – 0.00000029 = 0.99999942
Entre μ – 6σ y μ + 6σ se encuentra el 99.9999998% de las observaciones. Es
decir que:
P(μ – 6σ X μ + 6σ) =
6 6
6 6P Z P Z
= Φ (6) - Φ (-6) = 0.999999999 – 0.000000001 = 0.999999998
1.3 PROPIEDAD REPRODUCTIVA DE LA DISTRIBUCIÓN NORMAL
Sean X1 , X2 , .... , Xn , n variables aleatorias independientes distribuidas
normalmente con media μi y varianza σi
2
. Es decir: Xi ~ N(μi , σi
2
) i = 1, 2, 3,
.... , n . Si Y es una combinación lineal de las v.a. Xi : Y = a0 + a1 X1 + a2 X2 + .... +
an Xn . Entonces, la variable aleatoria Y ~ N [a0 +
n
i
iia
1
,
n
i
iia
1
22
]
10. 10
Puesto que:
μY = E(Y) = E (a0 + a1 X1 + a2 X2 + .... + an Xn ) =
= E(a0 ) + E (a1 X1 ) + E (a2 X2 ) + .... + E (an Xn ) =
= a0 + a1 E(X1 ) + a2 E(X2 ) + .... + an E(Xn ) =
= a0 + a1 μ1 + a2 μ2 + .... + an μn = a0 +
n
i
iia
1
2
Y = V(Y) = V (a0 + a1 X1 + a2 X2 + .... + an Xn ) =
= V(a0 ) + V(a1 X1 ) + V(a2 X2 ) + .... + V(an Xn ) =
= 0 + a1
2
V(X1 ) + a2
2
V(X2 ) + .... + an
2
V(Xn ) =
= a1
2
σ1
2
+ a2
2
σ2
2
+ .... + a2
n σn
2
=
n
i
iia
1
22
1.4 TEOREMA DEL LÍMITE CENTRAL
Sean X1 , X2 , .... , Xn , n variables aleatorias independientes con media y varianza finitas
dadas por: E(Xi) = μi y V(Xi ) = σi
2
.
Si: Yn = X1 + X2 + .... + Xn =
n
i
iX
1
, entonces bajo ciertas condiciones generales,
la variable aleatoria Zn definida por:
n
i
i
n
i
n
i
ii
n
nn
n
X
YV
YEY
Z
1
2
1 1
)(
)(
tiene aproximadamente una distribución normal estándar N(0, 1).
Nota.-
E(Yn ) = E (X1 + X2 + .... + Xn ) = E (X1 ) + E (X2 ) + .... + E (Xn ) =
11. 11
= μ1 + μ2 + .... + μn =
n
i
i
1
.
V(Yn ) = V (X1 + X2 + .... + Xn ) = V(X1 ) + V(X2 ) + .... + V(Xn ) =
= σ1
2
+ σ2
2
+ .... + σn
2
=
n
i
i
1
2
.
Observaciones.-
1. La variable aleatoria Yn =
n
i
iX
1
(suma de v.a. independientes) puede ser
aproximada por una v.a. distribuida normalmente, cualquiera que sea la distribución
de las Xi .
2. Las condiciones generales indicadas en el teorema están referidas a que los términos
Xi tomados individualmente, contribuyen con una cantidad despreciable a la
variación de la suma, y no es probable que un simple término tenga una gran
contribución a la suma.
Una aplicación importante de estas condiciones generales del teorema central del
límite, se da en los modelos de regresión: Yi = β0 + β1 X1i + β2 X2i + .... + βk Xki + ei
Donde la variable explicada o dependiente Y es función de un conjunto de variables
explicativas o independientes (X1 , X2 , .... , Xk ) más un error e. La aplicación del
teorema central del límite se da cuando se asume que los errores ei se distribuyen
normalmente, debido a que estos errores recogen la suma de las contribuciones
despreciables de todas las variables dejadas de considerar en el modelo.
Por ejemplo, en los modelos de demanda Qi = a – b Pi + ei , se asume que las
cantidades demandadas (Q) de un bien o servicio dependen fundamentalmente del
precio (P) del bien. Efectivamente, pero existen otras variables independientes
(gastos de publicidad, precio del bien sustituto, gustos y preferencias, etc.) que
también podrían explicar dicha demanda, sin embargo, sus contribuciones a explicar
la demanda son despreciables, por lo que la suma de sus contribuciones, reflejadas en
los errores ei se aproximan a la distribución normal.
12. 12
3. Una situación especial del teorema central del límite se presenta cuando cada Xi
tiene la misma distribución (que es el caso de la definición de muestra aleatoria,
como veremos más adelante) y que permita encontrar la distribución de una media
muestral. La propuesta es la siguiente:
Sean X1 , X2 , .... , Xn , n variables aleatorias independientes, idénticamente
distribuidas con media y varianza común y finitas dadas por: E(Xi) = μ y V(Xi ) = σ2
.
Si: Yn = X1 + X2 + .... + Xn =
n
i
iX
1
, entonces la variable aleatoria Zn dada
por :
n
X
n
nX
YV
YEY
Z n
n
i
i
n
nn
n
/)(
)( 1
tiene aproximadamente distribución normal estándar N(0 , 1). Donde
n
i
in X
n
X
1
1
es la media muestral de las Xi .
Nota.-
E(Yn ) = E (X1 + X2 + .... + Xn ) = E (X1 ) + E (X2 ) + .... + E (Xn ) =
= μ + μ + .... + μ = n μ .
V(Yn ) = V (X1 + X2 + .... + Xn ) = V(X1 ) + V(X2 ) + .... + V(Xn ) =
= σ2
+ σ2
+ .... + σ2
= n σ2
13. 13
1.5 EJERCICIOS RESUELTOS
1. Sea Z una variable aleatoria con distribución normal estándar [Z ~ N(0, 1)]. Hallar
las probabilidades siguientes: a) P(Z > 1.13) ; b) P(1.00 < Z < 1.42) c) P(-1.5 < Z <
0.50) ; d) P(-1.65 < Z < -1.00) ; e) P(Z < -1.52) ; f) P(0 < Z < 1.25) y g)
P(-1.63 < Z < 0).
Solución.-Usando la tabla 1 del anexo se tiene:
a) P(Z > 1.13) = 1 - P(Z ≤ 1.13) = 1 – Φ(1.13) = 1 – 0.8708 = 0.1292
b) P(1.00 < Z < 1.42) = Φ(1.42) - Φ(1.00) = 0.9222 – 0.8413 = 0.0809
Para obtener los gráficos en Minitab ver Bazán, Juan (2010)
0.4
0.3
0.2
0.1
0.0
Z
Densidad
1
0.0809
1.420
En Minitab: P(1.00 < Z < 1.42)
0.4
0.3
0.2
0.1
0.0
Z
Densidad
-1.5
0.6247
0.50
P(-1.5 Z < 0.5)
c) P(-1.5 Z < 0.5) = Φ(0.50) - Φ(-1.5) = 0.6915 – 0.0668 = 0.6247
d) P(-1.65 Z -1.00) = Φ(-1.00) - Φ(-1.65) = 0.1587 – 0.0495 = 0.1092
e) P(Z < -1.52) = Φ(-1.52) = 1 - Φ(1.52) = 1 – 0.9357 = 0.0643
f) P(0 Z 1.25) = Φ(1.25) - Φ(0) = 0.8944 – 0.5000 = 0.3944
g) P(-1.63 < Z 0) = Φ(0) - Φ(-1.63) = 0.5000 – 0.0516 = 0.4484
2. Sea Z una variable aleatoria normal estándar [Z ~ N(0, 1)]. Hallar el valor de z
para los casos siguientes: a) Φ(z) = 0.9500; b) Φ(z) = 0.9772; c) Φ(z) =
0.9987; d) el área entre –z y z es 0.95; e) el área a la izquierda de z es 0.01; y
f) el área a la derecha de z es 0.05.
14. 14
Solución
a) Sí Φ (z) = F (z) = P [Z z] = 0.9500, esto implica que, en la tabla 1, a la
probabilidad 0.9500, le corresponde z = Z0.9500 = 1.645 aproximadamente.
b) Sí Φ (z) = F (z) = P [Z z] = 0.9772, esto implica que, en la tabla 1, a la
probabilidad 0.9772, le corresponde z = Z0.9772 = 2.00 aproximadamente.
c) Sí Φ (z) = F (z) = P [Z z] = 0.9987, esto implica que, en la tabla 1, a la
probabilidad 0.9987, le corresponde z = Z0.9987 = 3.00aproximadamente.
d) Si 0.95 = P [-z Z z] = Φ (z) - Φ (-z) = Φ (z) – [1 - Φ (z)] = 2 Φ (z) – 1.
Entonces, Φ (z) = 0.9750 y en la tabla le corresponde a z = Z0.9750 = 1.96.
e) Si 0.01 = Φ (z) = P [Z z], esto implica que, en la tabla 1, a la probabilidad
0.01, le corresponde z = Z0.01 = -2.33 aproximadamente.
f) Si 0.05 = P [Z ≥ z] = 1 - Φ (z), entonces Φ (z) = 0.9500 y de acuerdo a lo
visto en la parte a) de este problema le corresponde a z = Z0.9500 = 1.645.
3. El monto de las solicitudes de préstamo de los comerciantes que recibe un
Banco, está distribuido aproximadamente en forma normal con μ = S/. 10,000 y
σ = S/. 1,000. Calcule e interprete la probabilidad de que el monto del préstamo
solicitado: a) Esté entre S/. 8,500 y 12,000; b) Sea menor que S/. 8,000; c)
Mayores de que cantidad será el 20 % de los préstamos?
Solución
Sea X = monto de las solicitudes de préstamo.
Se sabe que X ~ N(10000 , 10002
), entonces Z = (X – 10000)/ 1000 ~ N(0,
1). Luego, las probabilidades solicitadas son:
a) P(8500 ≤ X ≤ 12000) =
8500 10000 10000 12000 10000
1000 1000 1000
X
P
=
= P(-1.5 ≤ Z ≤ 2.0) = Φ(2.00) - Φ(-1.50) = 0.97725 – 0.06681 = 0.91044
Rpta.
Interpretación: el 91.04% de los montos de préstamo solicitados por los
comerciantes fluctúa entre S/. 8,500 y 12,000.
15. 15
b) P(X ≤ 8000) =
10000 8000 10000
1000 1000
X
P
=
= P(Z ≤ -2.0) = Φ(-2.00) = 0.02275 Rpta.
Interpretación: el 2.28% (ó en 228 de cada 10000 solicitudes) de los montos
de préstamo solicitados por los comerciantes es menor a S/. 8,000.
0.0004
0.0003
0.0002
0.0001
0.0000
X = monto del préstamo
Densidad
8000
0.0228
10000
Normal, Media=10000, Desv.Est.=1000
Distribución del monto de préstamo
Resultado gráfico en Minitab
c) Sea C la cantidad de préstamo buscada, entonces:
0.20 = P(X > C) = 1 -
10000
1000
C
P Z
0.80 =
10000
1000
C
0 . 8 0
10000
0.84
1000
C
Z
C = S/. 10840
Rpta.
Interpretación: el 20% de los montos de préstamo solicitados por los
comerciantes es mayor a S/. 10,840.
16. 16
0.0004
0.0003
0.0002
0.0001
0.0000
X = monto del préstamo
Densidad
10840
0.20
10000
Normal, Media=10000, Desv.Est.=1000
Distribución del monto de préstamo
4. Para cierto examen la calificación vigesimal tiene distribución normal con media
11 y desviación estándar 2. Se desea desaprobar al 40% de los examinados.
¿Cuál debe ser la calificación máxima desaprobatoria? Interprete el resultado.
Solución
Sea X = calificación vigesimal de los examinados.
Se sabe que X ~ N(11 , 22
), entonces Z = (X – 11)/ 2 ~ N(0, 1).
Sea M la máxima nota desaprobatoria buscada, entonces:
0.40 = P(X < M) =
11
2
M
P Z
=
11
2
M
0.40
11
0.25
2
M
Z
M = 10.5 Rpta.
Interpretación: el 40% de los examinados desaprobados tiene nota menor a 10.5.
5. Los ingresos de los trabajadores tiene distribución normal con media µ= S/.
1000 y desviación estándar σ = S/. 200. Si se selecciona a 2000 de estos
trabajadores, calcule e interprete:
a) ¿Cuántos trabajadores tienen ingreso menor a S/. 600?
b) ¿Cuántos trabajadores tienen ingreso entre S/. 850 y 1300?
Solución
17. 17
Si X = ingreso de los trabajadores ~ N(1000, 2002
), Z = (X – 1000)/ 200 ~ N(0,
1).
Para determinar cuántos de los n = 2000 trabajadores tienen ingresos en los
intervalos dados, primero se determina la probabilidad P y después multiplica
por n. Se pide:
a) P = P(X < 600) =
1000 600 1000
200 200
X
P
= P(Z < -2.0) = Φ(-2.0) =
0.02275
Luego nP = 0.02275 x 2000 = 45.5 trabajadores Rpta.
Interpretación: 46 trabajadores (2.28%) tienen ingreso menor a S/. 600.
b) P = P(850 ≤ X ≤ 1300) =
850 1000 1000 1300 1000
200 200 200
X
P
=
= P(-0.75 ≤ Z ≤ 1.5) = Φ(1.5) - Φ(-0.75) = 0.93319 – 0.22663 = 0.70656
0.0020
0.0015
0.0010
0.0005
0.0000
X = ingreso
Densidad
850
0.7066
13001000
Normal, Media=1000, Desv.Est.=200
Distribución del ingreso
Luego nP = 0.70656 x 2000 = 1413.12 trabajadores Rpta.
Interpretación: alrededor de 1413 trabajadores (70.66%) tienen ingreso entre
S/. 850 y 1300.
6. El volumen de negociaciones diarias (en millones de nuevos soles) para las
acciones comercializadas en la bolsa de Lima tiene distribución normal con
media µ= 800 y desviación estándar σ = 100. En un período de 60 días, calcule e
interprete:
a) ¿En cuántos días el volumen de negociaciones es de 600 o menos millones?
b) ¿En cuántos días el volumen de negociaciones es mayor de 900 millones?
18. 18
Solución
Si X = volumen diario de negociaciones en millones de S/. ~ N(800, 1002
)
Z = (X – 800)/ 100 ~ N(0, 1).
Para determinar en cuántos de los n = 60 días el volumen de las negociaciones
está en los intervalos dados, primero se determina la probabilidad P y después
multiplica por n. Se pide:
a) P = P(X ≤ 600) =
800 600 800
100 100
X
P
= P(Z < -2.0) = Φ(-2.0) =
0.02275
Luego nP = 0.02275 x 60 = 1.4 días Rpta.
Interpretación: en alrededor de 1.4 días (2.28%) el volumen de
negociaciones es de 600 o menos millones de nuevos soles.
b) P = P(X > 900) =
800 900 800
100 100
X
P
= P(Z > 1.0) = 1 - Φ(1.0) =
= 1 – 0.84134 = 0.15866. Luego nP = 0.15866 x 60 = 9.5días Rpta.
Interpretación: en alrededor de 9.5 días (15.87%) el volumen de
negociaciones es mayor de 900 millones de nuevos soles.
7. El peso de los pernos fabricados se distribuye normalmente con media µ= 80 gr.
y desviación estándar σ = 5 gr. Si se almacenan 2000 pernos, calcule e interprete
¿qué cantidad de pernos pesan: a) menos de 70 gramos? y b) entre 75 y 90
gramos?
Solución
Si X = peso de los pernos ~ N(80, 52
) Z = (X – 80)/ 5 ~ N(0, 1).
Para determinar cuántos de los n = 2000 pernos tienen un peso en los intervalos
dados, primero se determina la probabilidad P y después multiplica por n. Se
pide:
a) P = P(X < 70) =
80 70 80
5 5
X
P
= P(Z < -2.0) = Φ(-2.0) = 0.02275
Luego nP = 0.02275 x 2000 = 46 pernos Rpta.
Interpretación: alrededor de 46 pernos (2.28%) pesan menos de 70 gramos.
b) P = P(75 ≤ X ≤ 90) =
75 80 80 90 80
5 5 5
X
P
= P(-1 ≤ Z ≤ 2) =
19. 19
= Φ(2.0) - Φ(-1.0) = 0.97725 – 0.15866 = 0.81859.
0.09
0.08
0.07
0.06
0.05
0.04
0.03
0.02
0.01
0.00
X = peso
Densidad
75
0.8186
9080
Normal, Media=80, Desv.Est.=5
Distribución del peso de los pernos
Resultado gráfico en Minitab
Luego nP = 0.81859 x 2000 = 1637 pernos Rpta.
Interpretación: alrededor de 1637 pernos (81.86%) pesan entre 75 y 90
gramos.
8. El tiempo necesario para terminar un examen se distribuye normalmente con
media µ= 80 minutos y desviación estándar σ = 10 minutos. En un curso de 60
alumnos, calcule e interprete cuántos alumnos terminan el examen:
a) ¿en una hora o menos?
b) ¿en más de 60 minutos, pero en menos de 75 minutos?
c) ¿Cuántos alumnos no terminan el examen, si éste dura 90 minutos?
Solución
Si X = tiempo para terminar un examen ~ N(80, 102
)
Z = (X – 80)/ 10 ~ N(0, 1).
Para determinar cuántos de los n = 60 alumnos terminan el examen en los
intervalos dados, primero se determina la probabilidad P y después multiplica
por n. Se pide:
a) P = P(X ≤ 60) =
80 60 80
10 10
X
P
= P(Z ≤ -2.0) = Φ(-2.0) = 0.02275.
Luego nP = 0.02275 x 60 = 1.4 alumnos Rpta.
20. 20
Interpretación: alrededor de 1.4 alumnos (2.28%) terminan el examen en una
hora o menos.
b) P = P(60 ≤ X ≤ 75) =
60 80 80 75 80
10 10 10
X
P
= P(-2 ≤ Z ≤ -0.5) =
= Φ(-0.50) - Φ(-2.0) = 0.30854 – 0.02275 = 0.28579.
Resultado gráfico en Minitab
0.04
0.03
0.02
0.01
0.00
X = tiempo duración examen
Densidad
60
0.286
75 80
Normal, Media=80, Desv.Est.=10
Distribución tiempo duración examen
Luego nP = 0.28579 x 60 = 17 alumnos Rpta.
Interpretación: alrededor de 17 alumnos (28.6%) terminan el examen en más
de 60 minutos, pero en menos de 75 minutos.
c) P = P(X > 90) =
80 90 80
10 10
X
P
= P(Z > 1.0) = 1 - Φ(1.0) =
= 1 – 0.84134 = 0.15866.
Luego nP = 0.15866 x 60 = 9.5 alumnos Rpta.
Interpretación: alrededor de 10 alumnos (15.87%) no terminan el examen, si
éste dura 90 minutos.
9. Suponga que el ingreso familiar mensual (X) en una comunidad tiene
distribución normal con media $400 y desviación estándar $50. Si los gastos de
consumo familiar (C) están dados por la relación C = 0.80 X + 50, ¿calcule e
interprete la probabilidad de que los gastos de consumo familiar sean inferiores a
$320?
Solución
21. 21
Si X = ingreso familiar mensual ~ N(400, 502
), Z = (X – 400)/ 50 ~ N(0, 1).
Se pide:
P(C < 320) = P(0.80 X + 50 < 320) = P(X < 337.5) =
=
400 337.5 400
50 50
X
P
= P(Z < -1.25)
= Φ(-1.25) = 0.10565 Rpta.
Otra forma de resolver es usando la propiedad reproductiva de la distribución
normal. Sí C = 0.80 X + 50, entonces la media y la varianza de C son:
( ) 0.8 ( ) 50 0.8(400) 50 370C E C E X
22 2
(0.8 50) 0.8 ( ) 0.64(2500) 1600 40C Var X Var X
Luego C ~ N(370, 402
), Z = (C – 370)/ 40 ~ N(0, 1). Entonces:
P(C < 320) =
370 320 370
40 40
C
P
= P(Z < -1.25) = Φ(-1.25) = 0.10565
Rpta.
Interpretación: el 10.6% de (ó en 1057 de cada 10000 familias) los gastos de
consumo familiar en la comunidad son menores a S/. 320.
10. Sean Xl , X2 y X3 variables a1eatorias independientes tales que: X1 ~ N (10 , 3 )
; X2 ~ N (12 , 4 ) y X3 ~ N (14 , 6). Si Y = X1 - 2 X2 + X3 . Se pide:
a) Hallar la media y la varianza de Y ; b) Ca1cule e interprete 8 10P Y
Solución
X1 ~ N (10 , 3 ) 1 10 ; 32
1
X2 ~ N (12 , 4 ) 2 12 ; 42
2
X3 ~ N (14 , 6 ) 3 14 ; 2
3 6
a) Cálculo de la media y la varianza de Y
1 2 3 1 2 32 ( ) 2 ( ) ( )Y E Y E X X X E X E X E X =
1 2 32 10 2(12) 14 0Y Rpta.
2
1 2 3 1 2 3( ) ( 2 ) ( ) 4 ( ) ( )Y V Y V X X X V X V X V X
2 2 2 2
1 2 34 3 4(4) 6 25Y Rpta.
22. 22
b) Cálculo de la 8 10P Y
Sabemos que 0Y y 252
Y 5Y .
Además Y ~ N [0, 25] Z = (Y – 0)/ 5 ~ N(0, 1). Luego:
8 0 0 10 0
8 10 1.6 2
5 5 5
Y
P Y P P Z
= Φ(2.0) - Φ(-1.60) = 0.97725 – 0.05480 = 0.92245 Rpta.
Interpretación: alrededor del 92.25% de los valores observados de Y se
encuentran entre -8 y 10.
11. Sean X1, X2, X3 y X4 variables aleatorias normales independientes con μ1
30; μ2 = 25 ; μ3 = 12 ; μ4 = 8 ;
2
1 = 8 ;
2
2 = 6 ;
2
3 = 6 ;
2
4 = 2. Sí:
Y =
4
2 21 XX
- 3 4
2
X X
Calcule e interprete: a) 8 14P Y y b) P 12Y
Solución:
Y =
4
2 21 XX
- 3 4
2
X X
= 31 2 4
4 2 2 2
XX X X
μY = E(Y) = 1 2 3 4
1 1 1 1
4 2 2 2
E X E X E X E X
=
1 1 1 1
(30) (25) (12) (8) 10
4 2 2 2
2
Y = V (y) = 1 2 3 4
1 1 1 1
( ) ( ) ( ) ( )
16 4 4 4
V X V X V X V X
=
1 1 1 1
(8) (6) (6) (2) 4
16 4 4 4
Siendo Y una combinación lineal de las variables independientes Xi cada una
con distribución normal, entonces por la propiedad reproductiva de la
distribución normal se cumple que Y ~ N [10, 4] Z = (Y – 10)/ 2 ~ N(0, 1).
Luego:
a) 8 14P Y =
8 10 10 14 10
2 2 2
Y
P
= P (-1.0 ≤ Z ≤ 2.0) =
= Φ(2.0) - Φ(-1.0) = 0.97725 – 0.15866 = 0.81859 Rpta.
23. 23
Interpretación: el 81.86% de los valores de Y se encuentran entre 8 y 14.
b) P 12Y = 12 12P Y =
12 10 10 12 10
2 2 2
Y
P
=
= P (-11.0 ≤ Z ≤ 2.0) = Φ(2.0) - Φ(-11.0) =
= 0.97725 – 0.00000 = 0.0.97725 Rpta.
Interpretación: alrededor del 97.73% de los valores absolutos de Y son
menores o iguales a 12.
12. En el proceso de fabricación de condensadores, varias pruebas han demostrado
que la temperatura más alta (en °C) que pueden soportar es N(125, 9). En los
sistemas en que se utilizan, la temperatura máxima (en °C) a que se sujeta un
condensador individual es N(116, 16). ¿Qué proporción de condensadores fallará
por sobre calentamiento? Interprete el resultado.
Solución
Sean: F = temperatura más alta de fabricación ~ N(125, 9) y
U = temperatura máxima de uso ~ N(116, 16)
Habrá falla por sobrecalentamiento (S) cuando S = F < U = F – U < 0.
Para hallar la proporción solicitada mediante P(S) = P(F < U) = P(F – U < 0)
determinamos la distribución de F – U usando la propiedad reproductiva de la
distribución normal, así:
F – U ~ N(9, 25) Z = ( F – U – 9)/ 5 ~ N(0, 1).
Entonces:
P(S) = P(F < U) = P(F – U < 0) =
80 0 9
5 5
F U
P
=
= P(Z ≤ -1.8) = Φ(-1.8) = 0.03593 Rpta.
Interpretación: alrededor del 3.59% de los (ó 359 de cada 10000) condensadores
fabricados falla por sobrecalentamiento en los sistemas en que se utilizan.
13. En una de las etapas de un proceso de ensamble un tapón cilíndrico tiene que
ajustarse a una abertura circular seleccionando cada elemento al azar en un
suministro continuo. Los diámetros del tapón y de los casquillos en mm, son
N(24.9, 0.032
) y N(25, 0.042
) respectivamente. Si para que el ajuste sea
24. 24
satisfactorio se requiere un claro de diámetro de cuando menos 0.02 mm, ¿en
qué proporción de los casos el ajuste no será satisfactorio? Interprete el
resultado. (claro del diámetro = diámetro del casquillo – diámetro del tapón)
Solución
Sean: T = diámetro del tapón ~ N(24.9, 0.032
) y
C = diámetro del casquillo ~ N(25, 0.042
)
Si X = claro del diámetro = C – T, usando la propiedad reproductiva de la
distribución normal se tiene que:
µX = E(X) = E(C – T) = E(C) – E(T) = 25.0 – 24.9 = 0.10
σ2
X = V(X) = V(C – T) = V(C) + V(T) = 0.0009 +0.0016 = 0.0025 = 0.052
.
Luego: X = claro del diámetro = C – T ~ N(0.10, 0.052
)
Z = (X – 0.10)/ 0.05 ~ N(0, 1).
Que el ajuste no sea satisfactorio implica que X < 0.02. Entonces:
P(X < 0.02) =
0.10 0.02 0.10
0.05 0.05
X
P
= P(Z ≤ -1.8) = Φ(-1.6) = 0.0548
Rpta.
Interpretación: en alrededor del 5.48% de los (ó en 548 de cada 10000)
ensambles el tapón no se ajusta al casquillo.
14. Las pastillas metálicas cilíndricas que se utilizan en un reactor se fabrican en
serie y puede suponerse que sus longitudes siguen una distribución normal con
media 0.290 cm. y desviación estándar 0.016cm. Nueve de estas pastillas deben
ajustarse, extremo con extremo, en un recipiente que ocupa una longitud no
mayor de 2.670 cm. Si las nueve pastillas se ensamblan al azar, ¿qué proporción
de estos no se ajustará en el espacio requerido? Interprete el resultado.
Solución
Sean: Xi = diámetro de las pastillas ~ N(0.29, 0.0162
) y
L = longitud del recipiente con 9 pastillas =
9
1
i
i
X
.
Por la propiedad reproductiva de la distribución normal, se tiene que:
E(L) = E(
9
1
i
i
X
) =
9
1
( )i
i
E X
=
9
1
0.29
i
= 9 x 0.29 = 2.61 cm.
25. 25
V(L) = V(
9
1
i
i
X
) =
9
1
( )i
i
V X
=
9
2
1
0.016
i
= 9 x 0.0162
= 0.002304 cm2
.
Luego:
L = longitud del recipiente con 9 pastillas =
9
1
i
i
X
~ N(2.61, 0.0002304)
Z = (L – 2.61)/ 0.048 ~ N(0, 1).
Las 9 pastillas no se ajustan al espacio requerido si L > 2.67. Por lo tanto:
P(L > 2.67) = 1 – P(L ≤ 2.67) = 1 -
2.61 2.67 2.61
0.048 0.048
L
P
=
= 1 - P(Z ≤ 1.25) = 1 - Φ(1.25) = 1 - 0.89435 = 0.10565 Rpta.
Interpretación: en alrededor del 10.56% de los (ó en 1056 de cada 10000)
recipientes con 9 pastillas, éstas no se ajustan en el espacio requerido.
15. Suponga que las variables aleatorias X1 , X2 , .... , X50 representan la vida útil de
50 tubos electrónicos; los mismos que se usan de la siguiente manera: tan pronto
como falla el primer tubo, empieza a funcionar el segundo y cuando falla el
segundo empieza a funcionar el tercero, etc. Suponga que los Xi, i = 1, 2, …., 50
tienen distribución exponencial con parámetro λ = 1/500. ¿Cuál es la
probabilidad que el tiempo de funcionamiento de los 50 tubos esté comprendido
entre 20 000 y 30 000 horas? Interprete el resultado.
Solución
Sea Xi = tiempo de funcionamiento del tubo i ~ Exponencial (λ = 1/500)
Entonces µ = E(Xi) = 1/ λ = 500 , σ2
= 1/ λ2
= 5002
] i = 1, 2, …., 50.
Sea Y50 = tiempo de funcionamiento de los 50 tubos =
=
50
1 2 50
1
............ i
i
X X X X
Entonces, por el teorema del límite central la probabilidad solicitada es:
P(20 000 ≤ Y50 ≤ 30 000) =
=
50
1
50 500
20000 50 500 30000 50 500
500 50) 500 50) 500 50)
i
i
X x
x x
P
x x x
= P(-1.41 ≤ Z ≤
1.41)
26. 26
= Φ(1.41) - Φ(-1.41) = 0.92073 – 0.07927 = 0.84146 Rpta.
Interpretación: en alrededor del 84.15% de los (ó en 8415 de cada 10000)
tiempos de funcionamiento de 50 tubos estará comprendido entre 20 000 y 30
000 horas.
16. Las botellas de aceite vegetal “Primor” tienen un contenido medio de 1 litro y
una desviación estándar de 0.04. Para la distribución se acomodan en cajas de 36
botellas, Calcule e interprete la probabilidad que una caja contenga más de 36.6
litros.
Solución
Sea Xi = contenido de las botellas de aceite ~ [µ = 1, σ = 0.04 lts.]
Sea Y36 = contenido por caja de las 36 botellas =
=
36
1 2 36
1
............ i
i
X X X X
Entonces, por el teorema del límite central la probabilidad solicitada es:
P(Y36 > 36.6) = 1 - P(Y36 ≤ 36.6) = 1 -
36
1
36 1
36.6 36 1
0.04 36 0.04 36
i
i
X x
x
P
=
= 1 – P(Z ≤ 2.5) = 1- Φ(2.5) = 1 – 0.99379 = 0.00621 Rpta.
Interpretación: alrededor del 0.62% de las (ó en 62 de cada 10000) cajas con 36
botellas de aceite el contenido es de más de 36.6 litros.
17. En una ciudad grande el 20% de los hogares no tiene desagüe. Si se eligen 100
hogares al azar, calcule e interprete la probabilidad de que más de 30 hogares no
tengan desagüe.
Solución
Sea Xi = 1, si el hogar no tiene desagüe ~ Bernoulli [p = 0.20]
Sea Y100 = el total de hogares sin desagüe, entre los 100 elegidos =
=
100
1 2 100
1
............ i
i
X X X X
~ B[n = 100, p = 0.20] ó N[np = 20, npq =
16]
Entonces, por el teorema del límite central la probabilidad solicitada es:
27. 27
P(Y100 > 30) = 1 - P(Y100 ≤ 30) = 1 -
100
1
100 0.20
30 100 0.20
0.20 0.80 100 0.20 0.80 100
i
i
X x
x
P
x x
=
= 1 – P(Z ≤ 2.5) = 1- Φ(2.5) = 1 – 0.99379 = 0.00621 Rpta.
Interpretación: en alrededor del 0.62% de los (ó en 62 de cada 10000) grupos de
100 hogares escogidos, más de 30 hogares no tienen desagüe.
18. Un lote de 10 000 pavos tiene un peso medio de 7 Kg. y una desviación
estándar de 0.15 Kg. Este lote debe ser entregado a los vendedores minoristas a
razón de 100 cada uno. ¿Cuál es la probabilidad de que un vendedor cualquiera
de estos tomados al azar, reciba un peso total de menos de 697 kilos? Interprete
su resultado.
Solución
Sea Xi = peso de los pavos ~ [µ = 7, σ = 0.15 Kg.]
Sea Y100 = peso total de los 100 pavos =
100
1 2 100
1
............ i
i
X X X X
Entonces, por el teorema del límite central la probabilidad solicitada es:
P(Y100 < 697) =
100
1
100 7
697 100 7
0.15 100 0.15 100
i
i
X x
x
P
=
= P(Z < -2.0) = Φ(-2.0) = 0.02275 Rpta.
Interpretación: alrededor del 2.28% de los (ó 228 de cada 10000) vendedores
minoristas recibe un peso total menor a 697 Kg.
19. La Constructora “Techito” estima que el peso promedio de las personas que
vivirán en un edificio de apartamentos es de 68 Kg., con una desviación estándar
de 15 Kg. De acuerdo con la estimación, instala en el edificio un ascensor para
36 personas con capacidad máxima de 2700 Kg. Si la estimación es correcta,
calcule e interprete la probabilidad de que un cupo completo exceda la capacidad
del ascensor.
Solución
28. 28
Sea Xi = peso de las personas ~ [µ = 68, σ = 15 Kg.]
Sea Y36 = peso total de las 36 personas =
36
1 2 36
1
............ i
i
X X X X
Entonces, por el teorema del límite central la probabilidad solicitada es:
P(Y36 > 2700) = 1 - P(Y36 ≤ 2700) = 1 -
36
1
36 68
2700 36 68
15 36 15 36
i
i
X x
x
P
=
= 1 – P(Z ≤ 2.8) = 1- Φ(2.8) = 1 – 0.99744 = 0.00256 Rpta.
Interpretación: alrededor del 0.26% de los (ó en 256 de cada 10000) cupos
completos del ascensor con 36 personas exceden su capacidad máxima de 2700
Kg.
20. Las botellas de ron “Pepito” tienen un contenido medio de 2 litros y una
desviación estándar de 0.018. Para la distribución se acomodan en cajas de 36
botellas, Calcule e interprete la probabilidad que una caja contenga más de 72.36
litros.
Solución
Sea Xi = contenido de las botellas de ron ~ [µ = 2, σ = 0.018 lts.]
Sea Y36 = contenido por caja de las 36 botellas =
36
1 2 36
1
............ i
i
X X X X
Entonces, por el teorema del límite central la probabilidad solicitada es:
P(Y36 > 72.36) = 1 - P(Y36 ≤ 72.36) = 1 -
36
1
36 2
72.36 36 2
0.018 36 0.018 36
i
i
X x
x
P
=
= 1 – P(Z ≤ 3.33) = 1- Φ(3.33) = 1 – 0.99957 = 0.00043 Rpta.
Interpretación: alrededor del 0.04% de las (ó en 4 de cada 10000) cajas con 36
botellas de ron contienen más de 72.36 litros.
29. 29
EJERCICIOS PROPUESTOS
1. Sea Z una variable aleatoria con distribución normal estándar [Z ~ N(0, 1)].
Hallar las probabilidades siguientes:
a) P(Z ≤ 2.15)
b) P(0.80 < Z < 1.96)
c) P(-2.45 < Z ≤ 1.65)
d) P(-2.75 ≤ Z ≤ -0.65)
e) P(Z ≥ -1.38)
f) P(-2.57 ≤ Z < 0)
g) P(0 ≤ Z < 2.33).
2. Sea Z una variable aleatoria normal estándar [Z ~ N(0, 1)]. Hallar el valor de z
para los casos siguientes:
a) Φ(z) = 0.8665
b) Φ(z) = 0.9222
c) Φ(z) = 0.9972
d) el área entre –z y z es 0.99
e) el área a la izquierda de z es 0.05
f) el área a la derecha de z es 0.025
3. El contenido en las botellas de cierta gaseosa tiene distribución normal con
media µ= 1000 ml. y desviación estándar σ = 5 ml. Calcule e interprete la
probabilidad de que una botella de gaseosa tenga:
a) Entre 990 y 1005 ml.
b) Menos de 985 ml.
4. El precio que pagan los hogares por el kilo de pescado en una gran ciudad tiene
distribución normal con media µ= S/. 12 y desviación estándar σ = S/. 0.80.
Calcule e interprete la probabilidad de que el precio pagado por el kilo de
pescado:
a) Sea menor de S/. 10.
b) Se encuentre entre S/. 10.50 y 13.50.
c) Por arriba de que precio paga el 10% superior de los consumidores.
30. 30
5. El tiempo que dura la atención a los clientes de un negocio se distribuye
normalmente con media µ= 30 minutos y desviación estándar σ = 4 minutos.
Calcule e interprete la probabilidad de que el tiempo de atención a los clientes:
a) dure entre 25 y 40 minutos.
b) Entre que límites simétricos alrededor de µ dura el 95% de las atenciones.
6. El peso de las cajas de mango se distribuye normalmente con media µ= 20 Kg. y
desviación estándar σ = 0.5 Kg. Si se almacenan 2000 cajas, calcule e interprete
¿qué cantidad de cajas pesan:
a) menos de 19 kilos?
b) entre 19.5 y 21 kilos?
7. El peso de los huevos de gallina producidos por una avícola se distribuye
normalmente con media µ= 65 gr. y desviación estándar σ = 5 gr. Si se
almacenan 2000 huevos, calcule e interprete ¿qué cantidad de huevos pesan:
a) Menos de 70 gramos?
b) Entre 55 y 60 gramos?
8. La duración de ciertos focos eléctricos tiene distribución normal con media µ=
1000 horas y desviación estándar σ = 200 horas. Si compra 2000 de estos focos,
calcule e interprete:
a) ¿Cuántos focos durarán menos de 600 horas?
b) ¿Cuántos focos durarán entre 850 y 1300 horas?
9. El volumen de ventas diarias de bolsas de azúcar de la comercializadora
“Yapatera” tiene distribución normal con media µ= 800 bolsas y desviación
estándar σ = 100. En un período de 60 días, calcule e interprete:
a) ¿En cuántos días el volumen de ventas es de 600 o menos bolsas de azúcar?
b) ¿En cuántos días el volumen de ventas es mayor de 900 bolsas de azúcar?
10. Sean X1 y X2 variables aleatorias independientes distribuidas normalmente con
μ1 50; μ2 = 35;
2
1 = 10;
2
2 = 6. Si: Y = X1 - X2. Calcule e interprete:
a) La media y la varianza de Y
b) 10 25P Y
31. 31
11. Sean X1, X2 y X3 variables aleatorias independientes distribuidas normalmente
con μ1 10; μ2 = 15; μ3 = 12;
2
1 = 3;
2
2 = 4;
2
3 = 6. Sí: Y = X1 + 2 X2 -
X3
Calcule e interprete:
a) 20 40P Y
b) P 18Y
12. Los teléfonos celulares A y B tienen una duración (en días) que son N(2190,
2002
) y N(2878, 2502
) respectivamente. Si se prueba la vida de cada uno de los
teléfonos correspondientes a cada una de las marcas, ¿cuál es la probabilidad que
los A duren un año o más que los B? Interprete su resultado.
13. En una ciudad grande el 20% de hogares no tiene agua. Si se escogen 100
hogares, calcule e interprete la probabilidad que más de 30 no tengan agua.
14. Al lanzar una moneda 100 veces, calcule e interprete la probabilidad de obtener
entre 40 y 60 caras.
15. Las cajas con limón tienen un peso medio de 20 Kg. y una desviación estándar
de 750 gr. Calcule e interprete la probabilidad de que el peso de 410 cajas
recibidas al azar y cargadas en un camión, supere su capacidad máxima que es
de 8,250 kg.
16. Los pesos de los sacos de algodón Pima cosechados tienen una media de 50
kilos y una desviación estándar de 1.4 kilos. Calcule e interprete la probabilidad
de que el peso de 100 paquetes seleccionados al azar sea menor de 4975 kilos.
17. Las cajas con naranja tienen un peso medio de 15 Kg. y una desviación estándar
de 0.5 kilos. Calcule e interprete la probabilidad de que el peso de 400 cajas
tomadas al azar sea menor de 5,980 kg.
18. Un lote de 10 000 pollos para parrilla tiene un peso medio de 1 Kg. y una
desviación estándar de 0.05 Kg. Este lote debe ser entregado a las pollerías a
razón de 100 cada una. ¿Cuál es la probabilidad de que una pollería, cualquiera
32. 32
de estas tomada al azar, reciba un peso total de menos de 98.5 kilos? Interprete
su resultado.
19. Los pesos de los paquetes recibidos en las tiendas Ripley tienen una media de
580 libras y una desviación estándar de 80 libras. Calcule e interprete la
probabilidad de que el peso de 49 paquetes recibidos al azar y cargados en un
montacargas, supere su capacidad de 30 000 libras.
20. Un lote muy grande de cajas con palta tiene un peso medio μ = 20 Kg. y una
desviación estándar σ = 0.5 Kg. Este lote debe ser entregado a los
supermercados a razón de 100 cajas cada uno. Calcule e interprete ¿la
probabilidad de que un supermercado cualquiera, reciba un peso total de
menos de 1 990.2 Kg.?
33. 33
Capítulo 2. DISTRIBUCIONES MUESTRALES
“¿Hace falta remarcar que un país que no conoce su demografía,
tampoco conoce su economía? No se puede saber lo que un país
produce y ahorra si se ignora esta cosa fundamental: la población. ....
En un país donde no se puede contar a los hombres, menos aún se
puede contar la producción. Se desconoce el primero de sus factores:
el factor humano, el factor trabajo..”
José Carlos Mariátegui
CONTENIDO
2.1 Distribuciones muestral de la media.
2.2 Distribución muestral del total (conocida la media)
2.3 Distribución de la diferencia de medias muestrales.
2.4 Distribución muestral de la proporción.
2.5 Distribución muestral del total (conocida la proporción)
2.6 Distribución muestral de la diferencia de proporciones.
2.7 Ejercicios resueltos.
2.8 Ejercicios propuestos.
La estadística es una ciencia importante porque permite el conocimiento de la
población basándose en muestras aleatorias representativas. El principal problema de
la estadística es estudiar una población con función de cuantía o función de densidad,
f(x, θ) conocida o supuestamente conocida, con parámetro θ desconocido. Si se
conoce θ, la distribución de probabilidad queda determinada. Para ello, se toma una
muestra aleatoria de tamaño n (X1 , X2 , .... , Xn ) de una población de tamaño N y se
busca alguna función de esta muestra que estime el parámetro desconocido θ,
problema que será abordado con mayor detalle en el capítulo de estimación.
En este capítulo se desarrollan las distribuciones muestrales para muestras grandes (n
≥ 30 ) referidas a la media, a la diferencia de medias, a la proporción, a la diferencia
de proporciones y a los totales (conocida la distribución de la media y la proporción).
Cabe resaltar que el conocimiento de estas distribuciones muestrales es el soporte
fundamental para poder comprender el desarrollo de la estimación por intervalos y la
docimasia de hipótesis a tratar capítulos más adelante. A continuación se desarrolla
cada uno de los conceptos importantes de las distribuciones muestrales.
34. 34
Población.- es el conjunto de todas las unidades de análisis (individuos u objetos) a
ser observadas y que poseen una característica común. Es decir, es el conjunto de
todas las observaciones posibles que puede tomar una variable aleatoria X. Por
ejemplo, en todas las empresas podemos estudiar: el número de trabajadores, las
ventas, etc.; en todos los hogares podemos estudiar: los ingresos, los gastos, etc.
Muestra.- es una parte representativa de la población. La representatividad implica
adecuado: método de muestreo, tamaño de muestra, selección de la muestra y
propuesta de estimadores (fórmulas). Relacionado al ejemplo anterior, la muestra
vendría dada por una parte representativa de empresas u hogares.
Muestra Aleatoria.- Sea X una variable aleatoria con distribución de probabilidad
f(x) (función de cuantía o función de densidad) con media μ y varianza σ2
. Una
muestra aleatoria (m.a.) de tamaño n de X, es un conjunto de n variables aleatorias
(X1 , X2 , .... , Xn ) que cumplen:
1. Cada Xi (i = 1, 2, .... , n) tiene la misma distribución que X. Es decir, tienen la
misma distribución de probabilidades )()( xfxf XXi
, la misma función de
distribución acumulativa )()( xFxF XXi
, la misma media iX = E(Xi) = E(X)
= μ con
N
X
N
i
i
1
y la misma varianza 2
IX = V(Xi ) = V(X) =
N
X
N
i
i
1
2
2
)(
.
2. Las variables aleatorias Xi (i = 1, 2, .... , n) son independientes. Por lo tanto la
función de probabilidad conjunta de la muestra aleatoria X1 , X2 , .... , Xn está
dada por:
n
i
iXnXXXnXXX XfXfXfXfXXXf n
1
2121,....,, )()()....()(),....,,(21
.
Esta probabilidad de ocurrencia de la muestra observada, es importante en
estimación puntual, ya que allí representa la función de verosimilitud a
maximizar.
Nota:
35. 35
La definición de m.a. se cumple cuando la muestra proviene de una población
infinita (discreta o continua) y cuando la muestra se extrae con reemplazo de
una población finita.
La definición de m.a. no se cumple cuando el muestreo es sin reemplazo de una
población finita, ya que las v.a. X1 , X2 , .... , Xn no son independientes. Sin
embargo, si el tamaño n de la muestra es muy pequeño en comparación con el
tamaño N de la población (n < 5% N ) se cumple aproximadamente la
definición.
Ejemplo 1.-
Si se toma una m.a. de tamaño n, de una población X con distribución de Poisson,
con parámetro λ, hallar la función de probabilidad conjunta (función de
verosimilitud) para dicha muestra.
Solución:
Como la v.a. X ~ Poisson (λ), entonces Xi ~ Poisson (λ) y su función de
probabilidad es: ni
X
e
Xf
i
X
iX
i
,....,2,1,
!
)(
; Xi = 0, 1, 2, 3, ......
Luego la función de probabilidad conjunta (función de verosimilitud) será:
)()....()(),....,,( 2121,....,, 21 nXXXnXXX XfXfXfXXXf n
=
n
i i
X
X
ei
1 !
=
!1
1
X
eX
!2
2
X
eX
....
!n
X
X
en
=
=
n
i
i
n
X
X
e
n
i
i
1
!
1
, Xi = 0, 1, 2, 3, ...... ; i = 1, 2, .... , n .
Rpta.
Ejemplo 2.-
Si se toma una m.a. de tamaño n, de una población X con distribución N(μ , σ2
),
hallar la función de probabilidad conjunta (función de verosimilitud) para dicha
muestra.
Solución:
36. 36
Como la v.a. X ~ N(μ , σ2
), entonces Xi ~ N(μ , σ2
) y su función de probabilidad
está dada por:
,;
2
1
)(
22
2/)(
2 i
X
iX XeXf i
i = 1, 2, 3, .... , n.
Luego la función de densidad conjunta (función de verosimilitud) será:
)()....()(),....,,( 2121,....,, 21 nXXXnXXX XfXfXfXXXf n
=
=
22
1 2/)(
2
2
1
X
e
22
2 2/)(
2
2
1
X
e ....
22
2/)(
2
2
1
nX
e
=
=
,;
2
1 1
22
2/)(2
2 i
X
n
xe
n
i
i
i = 1, 2, 3, .... , n. Rpta.
Estadístico.- es una variable aleatoria que depende sólo de la muestra observada.
Así, si X1 , X2 , .... , Xn es una m.a. de una población X, entonces la media muestral
( X ) y la varianza muestral (s2
) son estadísticos. Donde:
n
X
X
n
i
i
1
y
1
)(
1
2
2
n
XX
s
n
i
i
Distribución muestral.- es la distribución de probabilidad de un estadístico.
Error estándar de un estadístico.- es la desviación estándar de la distribución
muestral de un estadístico.
Error relativo de un estadístico.- es el coeficiente de variación de la distribución
muestral de un estadístico.
Teorema 1.- Sea X1 , X2 , .... , Xn una muestra aleatoria de tamaño n de una
población X, con media E(X) = μ y varianza Var (X) = σ2
. Sea
n
X
X
n
i
i
1
la
media muestral, entonces: )(XE y
n
XVarX
2
2
)(
.
Teorema 2.- Sea X1 , X2 , .... , Xn una muestra aleatoria sin reemplazo de tamaño n
de una población X de tamaño N, con media E(X) = E(Xi ) = μ y varianza Var (X)
= Var (Xi) = σ2
.
Entonces: )(XE y
N
nN
n
S
N
nN
n
XVarX
22
2
1
)(
.
37. 37
Donde:
1
)(
1
2
2
N
X
S
N
i
i
, representa la cuasivarianza poblacional y el factor
1
N
nN
se llama factor de corrección para poblaciones finitas (f.c.p.f.) el mismo que
es descartado cuando la fracción de muestreo (f )
1
1
97.005.0
N
nN
N
n
f .
A continuación presentamos las distribuciones muestrales de la media, del total
(conocida la media), de la diferencia de medias muestrales, de la proporción, del total
(conocida la proporción) y de la diferencia de proporciones. Todas ellas de suma
importancia en el diario quehacer de muchos campos de la investigación científica,
ya que como estudiaremos más adelante, van a permitir la determinación de
intervalos de confianza y la verificación de hipótesis para los parámetros
poblacionales.
2.1 DISTRIBUCIÓN MUESTRAL DE LA MEDIA
Teorema 3.- Si X1 , X2 , .... , Xn es una muestra aleatoria de tamaño n de una
población X, con media E(X) = μ y varianza Var (X) = σ2
. Entonces, por el
teorema central del límite, la media muestral
n
X
X
n
i
i
1
tiene aproximadamente
distribución normal con media μ y varianza σ2
/n. )/,( 2
nNX . Y la variable
aleatoria
n
X
Z
/
)(
tiene aproximadamente distribución N(0, 1).
Este teorema es válido para cualquier población finita o infinita, discreta o continua,
cuando el tamaño de la muestra n ≥ 30. Si la población es normal, se cumple
cualquiera sea el tamaño n de la muestra.
Cuando la población es finita de N elementos y el muestreo es sin reemplazo, la
variables aleatorias Xi no son independientes, entonces la distribución de X es
hipergeométrica, con:
)(XE y
1
)(
2
2
N
nN
n
XVarX
. Luego:
38. 38
Teorema 4.- Si X1 , X2 , .... , Xn es una muestra aleatoria de tamaño n extraida sin
reemplazo de una población X finita de tamaño N, con media E(X) = μ y varianza
Var (X) = σ2
. Entonces, la media muestral
n
X
X
n
i
i
1
tiene aproximadamente
distribución normal con media μ y varianza
1
)(
2
2
N
nN
n
XVarX
. Y la
variable aleatoria
1
)(
N
nN
n
X
Z
tiene aproximadamente distribución N(0, 1).
Ejemplo 3.-
En Lima Metropolitana la botella de aceite “primor” de un litro tiene un precio
promedio de S/. 5.00 y una desviación estándar de S/. 0.40. Si se toman muestras
aleatorias de 50 precios, se pide calcular e interpretar: a) la probabilidad que el precio
promedio muestral se encuentre entre S/. 4.85 y 5.10; b) la probabilidad que el
precio medio muestral sea inferior a S/. 4.80; y c) dentro de que límites simétricos
alrededor del precio promedio verdadero se encontrará el 95 % de los precios
promedios muestrales.
Solución.-
Como datos del problema se tiene que: μ = S/. 5.00 , σ = S/. 0.40 y n = 50.
n
XVarX
2
2
)(
= (0.40)2
/ 50 = 0.0032 .057.0 X S/.
Luego: )0032.0;00.5(NX y )1,0(
057.0
)00.5(
N
X
Z
. Nos piden:
a) P(4.85 X 5.10) =
057.0
00.510.5
057.0
00.5
057.
00.585.4 X
P =
= P(-2.63 Z 1.75) = (1.75) - (-2.63) =
= 0.95994 – 0.00427 = 0.95567 Rpta.
Interpretación.- el 95.567% de los precios promedios muestrales de las botellas de
aceite “primor” de un litro, se encuentran entre S/. 4.85 y 5.10, para muestras de
50 precios.
b) P( X < 4.80) = 00022.0)51.3()
057.0
00.580.4
057.0
00.5
(
ZP
X
P
39. 39
Interpretación.- el 0.022% de los precios promedios muestrales de las botellas de
aceite “primor” de un litro, será inferior a S/. 4.80, para muestras de 50 precios.
c) Sean 5.00 – E y 5.00 + E los límites simétricos alrededor de la media μ = S/.
5.00, dentro de los cuales estará el 95 % de las X . Entonces:
0.95 = P(5.00 – E X 5.00 + E) =
)
057.0057.0
(
E
Z
E
P
=
975.0
057.0
1
057.0
2
057.0057.0
EEEE
11.0)057.0(96.196.1
057.0
975.0 EZ
E
. Luego los límites serán:
5.00 – E= 5.00 – 0.11 = S/. 4.89 y 5.00 + 0.11 = S/. 5.11. Es decir:
0.95 = P(4.89 X 5.11)
Interpretación.- el 95 % de los precios promedios muestrales de las botellas de
aceite “primor” de un litro, se encuentran entre S/. 4.89 y 5.11 alrededor de μ =
S/. 5.00, para muestras de 50 precios.
2.2 DISTRIBUCIÓN MUESTRAL DEL TOTAL (conocida la media)
En muchas situaciones vamos a estar interesados en efectuar estimaciones de un
total poblacional, conocida la media muestral, para lo cual se tiene que tener presente
lo siguiente:
Sí el promedio poblacional es:
N
X
N
i
i
1
El total de la población se define como: NXX
n
i
i 1
el cual es estimado por: XNNX ˆˆ
Utilizando la propiedad reproductiva de la distribución normal, el teorema
central del límite y los operadores esperanza y varianza para el estimador de
total, llegamos al resultado siguiente:
22
,ˆˆ XNNNXNNX y
XN
NXN
Z
~ N(0, 1)
Donde la varianza del estimador del total está dada por:
40. 40
n
NNXVarNXNVarNVarXVar X
2
2222
)()()ˆ()ˆ(
, si la
fracción de muestreo f = n / N 0.05 , o
1
)()()ˆ()ˆ(
2
2222
N
nN
n
NNXVarNXNVarNVarXVar X
, si
la fracción de muestreo f = n / N > 0.05.
2.3 DISTRIBUCIÓN DE LA DIFERENCIA DE MEDIAS MUESTRALES
Esta distribución va a surgir cuando estemos interesados en efectuar la comparación
de las medias de dos poblaciones. Por ejemplo: comparar el precio promedio
poblacional de un bien o servicio en la ciudad X (μX ) y el precio promedio
poblacional del mismo bien o servicio en la ciudad Y (μY ). O comparar los ingresos
promedios, ventas promedios, los rendimientos promedios, etc. no sólo entre
ciudades, sino también entre grupos.
Esta comparación se formula así: ¿Serán iguales los precios promedios de un bien o
servicio en las ciudades X e Y (o en las ciudades 1 y 2)? Que es idéntico a
plantearse ¿μX = μY o μX – μY = 0? o también ¿μ1 = μ2 o μ1 – μ2 = 0?
Es decir, que esta comparación se reduce a conocer la diferencia de medias
poblacionales, la misma que va a requerir tomar muestras aleatorias de ambas
poblaciones y estudiar el comportamiento de la media muestral en cada una de ellas,
de la siguiente manera:
Sea X1 , X2 , .... , Xn es una muestra aleatoria de tamaño n, de una población X de
tamaño N, con media E(X) = μX y varianza Var (X) = 2
X . Sabemos que la
media muestral
n
X
X
n
i
i
1
tiene aproximadamente distribución normal:
),( 2
XXNX . Donde:
n
X
X
2
2
o
1
)(
2
2
N
nN
n
XVar X
X
..... (1)
Sea Y1 , Y2 , .... , Ym una muestra aleatoria de tamaño m, de una población Y de
tamaño M, con media E(Y) = μY y varianza Var (Y) = 2
Y . Sabemos que la
media muestral
m
Y
Y
m
i
i
1
tiene aproximadamente distribución normal:
41. 41
),( 2
YYNY . Donde: m
Y
Y
2
2
o
1
)(
2
2
M
mM
m
YVar Y
Y
..... (2)
De (1) y (2) tenemos que X - Y es una variable aleatoria con media:
YXYXYX YEXEYXE
y varianza:
222
YXYX YVarXVarYXVar
2
YX =
n
X
2
+
m
Y
2
o
1
2
N
nN
n
X
+
1
2
M
mM
m
Y
.............. (3)
Además, por la propiedad reproductiva de la distribución normal, de (1) y (2) se tiene
que:
X - Y ~ N( YX , 2
YX ) y
YX
YXYX
Z
)( )
~ N(0 , 1)
donde YX se obtiene a partir de (3).
Sintetizamos lo expuesto hasta aquí en el teorema 5.
Teorema 5.- Si X y Y son las medias de dos muestras aleatorias (de tamaños n y
m) de dos poblaciones X e Y, con medias μX y μY , y varianzas Var (X) = 2
X y
Var (Y) = 2
Y , respectivamente, entonces la distribución muestral de la diferencia de
medias es aproximadamente normal N( YX , 2
YX ) y la variable aleatoria
mn
YX
Z
YX
YX
22
) )(
o
11
)(
22
)
M
mM
mN
nN
n
YX
Z
YX
YX
tiene
aproximadamente distribución normal estándar N(0 , 1).
Si n y m son mayores o iguales que 30, la aproximación a la normal para la
diferencia de medias muestrales es óptima.
Si las poblaciones X e Y son normales, el teorema se cumple para cualesquier
tamaño de muestra.
Ejemplo 4.-
Ciertas bolsas de café tienen un peso medio de 500 gr. y una desviación estándar de
20 gr. Cierto día de producción se toman independientemente dos muestras al azar
sin reposición, con n = 500 y m = 800. ¿Cuál es la probabilidad que los pesos medios
42. 42
de las dos muestras difieran a) en más de 2 gr.? y b) en menos de 1gr.? Interpretar
los resultados.
Solución.-
Sea X la muestra de tamaño n = 500 bolsas de café, con μX = 500 gr. y X = 20 gr.
Sea Y la muestra de tamaño m = 800 bolsas de café, con μY = 500 gr. y Y = 20 gr.
Luego: YX = YX = 500 – 500 = 0, 2
YX =
n
X
2
+
m
Y
2
=
800
20
500
20 22
=
1.3 y YX = 1.14 gr.
Además, X - Y ~ N(0, 1.3) y
14.1
0
YX
Z ~ N(0 , 1). Nos piden:
a) P ( X - Y > 2 ) = 1 - P ( X - Y 2 ) = 1 - P(-2 X - Y 2) =
= 1 -
14.1
02
14.1
0
14.1
02 YX
P = 1 - P(-1.75 Z
1.75) =
= 1 – [ (1.75) - (-1.75)] = 1 - [ (1.75) – 1 + (1.75)] =
= 2 – 2 (1.75) = 2 – 2 (0.95994) = 0.08012 Rpta.
Interpretación.- en el 8.01% de las comparaciones, para muestras de 500 y 800
bolsas de café respectivamente, las diferencias de pesos medios serán mayores a 2
gramos.
b) P ( X - Y < 1 ) = P( -1 < X - Y < 1) =
=
14.1
01
14.1
0
14.1
01 YX
P = P(-0.88 Z 0.88) =
= (0.88) - (-0.88) = 0.81057 – 0.18943 = 0.62114 Rpta.
Interpretación.- en el 62.11% de las comparaciones, para muestras de 500 y 800
bolsas de café respectivamente, las diferencias de pesos medios serán menores de
1 gramo.
43. 43
2.4 DISTRIBUCIÓN MUESTRAL DE LA PROPORCIÓN
En muchos estudios vamos a estar interesados en clasificar los datos cualitativos o
cuantitativos de la población en dos clases distintas (población dicotómica o
binomial) tales como: éxitos y fracasos; hombres y mujeres; a favor y en contra;
aprueba y desaprueba; jóvenes (menores de x años) y adultos (de x años y más);
caras y sellos; empleados y desempleados; etc.
En este caso, se desea estimar la proporción de unidades (P) o el número total de
unidades (A) en la población que poseen una cierta característica o atributo que
cae dentro de una clase definida. Por ejemplo, se desea estimar:
- El porcentaje (o número) de personas que consumen un cierto producto.
- El porcentaje (o número) de clientes que compran más de 10 000 dólares
mensuales.
- El porcentaje (o número) de ciudadanos que está a favor de un personaje.
Notación: Además de la notación usada anteriormente, si se define la v.a.
Bernoulli:
Xi = 1, si la unidad estadística observada posee la característica de interés
(éxito).
Xi = 0, si la unidad estadística no posee la característica de interés (fracaso).
Entonces:
N
X
PyXA
N
i
iN
i
i
1
1
representan el número total de unidades (A) y la
proporción (P) de unidades en la población que poseen una cierta característica.
Suponga que se extrae una muestra aleatoria simple de tamaño n de la población
binomial, entonces la proporción muestral p definida como:
.,1
Paestima
n
X
n
X
p
n
i
i
44. 44
X =
n
i
iX
1
= número de éxitos en la muestra es una v.a. Binomial (n, P). La
proporción muestral p, es una media muestral de v.a. Bernoulli con E(Xi ) = P y
V(Xi ) = P Q; representa la proporción de éxitos en la muestra y estima a la
proporción de éxitos en la población P. Es decir, que p tiene el mismo
comportamiento de una media muestral X . Por lo tanto:
PnP
n
P
n
XE
nn
X
EpE
n
i
n
i
i
n
i
i
)(
11
)(
1
)(
11
1
2
11
)(
)(
n
XVar
n
X
VarpVar
n
i
i
n
i
i
(propiedad de la varianza)
2
22
1
2
1
)(
p
n
i
n
i
i
n
PQ
n
nPQ
n
PQ
n
XVar
Luego:
n
PQ
PN
n
X
n
X
p
n
i
i
,1
y
n
PQ
Pp
Z
~ N(0, 1)
Si el muestreo se efectúa sin reemplazo de una población binomial finita, la
distribución muestral de p sigue la distribución hipergeométrica y su varianza
requiere el factor de corrección para poblaciones finitas (salvo que la fracción de
muestreo f = n/N sea menor del 5%, donde no se utiliza). Entonces:
1
,1
N
nN
n
PQ
PN
n
X
n
X
p
n
i
i
45. 45
y
1N
nN
n
PQ
Pp
Z ~ N(0, 1)
Ejemplo 5.-
Según el Censo Nacional de Talla en Escolares de 19991
la desnutrición crónica en el
Perú era del 27.9%. Si se toma una muestra al azar sin reposición, de n = 1500 niños
y niñas. Calcule e interprete la probabilidad que: a) la desnutrición crónica muestral
se encuentre entre 26 y 30%? y b) dentro de que límites simétricos alrededor de la
proporción verdadera de desnutridos crónicos se encontrará el 95% de las
proporciones muestrales.
Solución.-
El mencionado Censo tiene los siguientes datos:
N = 2 059 426 niños y niñas censados como casos válidos = tamaño de la población.
X =
N
i
iX
1
= 574 314 niños y niñas desnutridos crónicos.
426,059'2
314,5741
N
X
N
X
P
N
i
i
= 0.279 = proporción censal de niños y niñas con
desnutrición crónica.
Q = 0.721 = proporción censal de niños y niñas sin desnutrición crónica.
n = 1500 niños y niñas = tamaño de la muestra.
Como la fracción de muestreo n/N es menor de 0.05, entonces, la proporción
muestral:
1
Ministerio de Educación. Nutrición y Retardo en el Crecimiento. Resultados del II Censo Nacional de Talla en Escolares 1999.
Lima, Perú, Noviembre de 2000.
46. 46
0001341.0;279.0,1
N
n
PQ
PN
n
X
n
X
p
n
i
i
y
0116.0
279.0
0001341.0
279.0
pp
n
PQ
Pp
Z ~ N(0, 1)
Se pide calcular:
a) P ( 0.26 p 0.30 ) =
0116.0
279.030.0
0116.0
279.0
0116.0
279.026.0 p
P
= P( -1.64 Z 1.81 ) = (1.81) - (-1.64) =
= 0.96485 – 0.05050 = 0.91435 Rpta.
Interpretación.- en el 91.44 % de las muestras de 1500 niños y niñas a nivel
nacional, el porcentaje de desnutridos crónicos, se encuentra entre el 26 y 30 %.
b) Sean 0.279 – E y 0.279 + E los límites simétricos alrededor de la proporción
verdadera P = 0.279 , dentro de los cuales estará el 95 % de las p. Entonces:
0.95 = P(0.279 – E p 0.279 + E) =
)
0116.00116.0
(
E
Z
E
P
=
975.0
0116.0
1
0116.0
2
0116.00116.0
EEEE
023.0)0116.0(96.196.1
0116.0
975.0 EZ
E
. Luego los límites serán:
0.279 – E = 0.279 – 0.023 = 0.256 y 0.279 + 0.023 = 0.302 . Es decir:
0.95 = P(0.256 p 0.302 ) Rpta.
Interpretación.- en el 95 % de las muestras de 1500 niños y niñas a nivel nacional,
la proporción de desnutridos crónicos se encontrará entre 0.256 y 0.302 alrededor
de la proporción verdadera P = 0.279.
47. 47
2.5 DISTRIBUCIÓN MUESTRAL DEL TOTAL (conocida la proporción)
En muchas situaciones vamos a estar interesados en efectuar estimaciones de un
total poblacional, conocida la proporción muestral, para lo cual se tiene que tener
presente lo siguiente:
Sí
N
X
P
N
i
i
1
representa la proporción (P) de unidades en la población que
poseen una cierta característica y
N
i
iXA
1
el número total (A) de unidades que
poseen dicha característica. Entonces:
El total de la población se define como: NPXA
N
i
i 1
el cual es estimado por: NpPNA ˆˆ
Utilizando la propiedad reproductiva de la distribución normal, el teorema
central del límite y los operadores esperanza y varianza para el estimador de
total, llegamos al resultado siguiente:
22
,ˆˆ pNNPNNpPNA y
pN
NPNp
Z
~ N(0, 1)
Donde la varianza del estimador del total está dada por:
n
PQ
NNpVarNNpVarPNVarAVar p
2222
)()()ˆ()ˆ( , si la
fracción de muestreo f = n / N 0.05 , o
1
)()()ˆ()ˆ( 2222
N
nN
n
PQ
NNpVarNNpVarPNVarAVar p , si
la fracción de muestreo f = n / N > 0.05.
48. 48
2.6 DISTRIBUCIÓN MUESTRAL DE LA DIFERENCIA DE
PROPORCIONES
Esta distribución surge cuando estemos interesados en efectuar la comparación de las
proporciones de dos poblaciones. Por ejemplo: comparar la proporción poblacional
de individuos que prefiere un bien o servicio en la ciudad 1 (P1 ) y la proporción
poblacional de individuos que prefiere el mismo bien o servicio en la ciudad 2 (P2 ).
Comparar las proporciones de aceptación no sólo entre ciudades, sino también entre
grupos.
Esta comparación se formula así: ¿Serán iguales las proporciones poblacionales de
individuos que prefieren un bien o servicio en las ciudades 1 y 2? Que es idéntico a
plantearse ¿ P1 = P2 o P1 – P2 = 0 ?
Es decir, que esta comparación se reduce a conocer la diferencia de proporciones
poblacionales, la misma que va a requerir tomar muestras aleatorias de ambas
poblaciones y estudiar el comportamiento de la proporción muestral en cada una de
ellas y de la diferencia p1 – p2 de la siguiente manera:
Suponga que se extrae una muestra aleatoria simple de tamaño n1 de la población
binomial 1, de tamaño N1 con una proporción de éxitos igual a P1. Sea X1 el
número de éxitos en la muestra de tamaño n1 , entonces la proporción muestral de
éxitos p1 , definida como
1
1
1
n
X
p estima a P1 y para n1 suficientemente
grande tiene aproximadamente distribución normal:
),( 2
11 1pPNp . Donde:
1
112
1
n
QP
p o
11
11
1
112
1
N
nN
n
QP
p ..... (1)
Suponga que se extrae una muestra aleatoria simple de tamaño n2 de la población
binomial 2, de tamaño N2 con una proporción de éxitos igual a P2. Sea X2 el
número de éxitos en la muestra de tamaño n2 , entonces la proporción muestral de
éxitos p2 , definida como
2
2
2
n
X
p estima a P2 y para n2 suficientemente
grande tiene aproximadamente distribución normal:
49. 49
),( 2
22 2pPNp . Donde:
2
222
2
n
QP
p o
12
22
2
222
2
N
nN
n
QP
p .....
(2)
Siendo p1 y p2 variables aleatorias independientes, cuyas distribuciones están
dadas en (1) y (2) tenemos que p1 – p2 es una variable aleatoria con media:
212121 2121
PPpEpEppE pppp
y varianza:
22
2121
2
2121 pppp pVarpVarppVar
2
21 pp =
1
11
n
QP
+
2
22
n
QP
o
11
11
1
11
N
nN
n
QP
+
12
22
2
22
N
nN
n
QP
............. (3)
Además, por la propiedad reproductiva de la distribución normal, de (1) y (2) se
tiene que:
p1 – p2 ~ N(P1 – P2 , 2
21 pp ) y
21
)( 2121
pp
PPpp
Z
~ N(0 , 1)
donde 21 pp se obtiene a partir de (3).
Sintetizamos lo expuesto hasta aquí en el teorema 6.
Teorema 6.- Si p1 y p2 son las proporciones de dos muestras aleatorias (de tamaños
n1 y n2 ) de las poblaciones binomiales 1 y 2, respectivamente, entonces la
distribución muestral de la diferencia de proporciones p1 - p2 ~ N(P1 – P2 , 2
21 pp )
y la variable aleatoria
2
22
1
11
2121 )(
n
QP
n
QP
PPpp
Z
o
11
)(
2
22
2
22
1
11
1
11
2121
N
nN
n
QP
N
nN
n
QP
PPpp
Z tiene aproximadamente distribución
normal estándar N(0 , 1).
50. 50
Si n1 y n2 son mayores o iguales que 30, la aproximación a la normal para la
diferencia de proporciones muestrales es óptima.
Ejemplo 6.-
Una empresa que trabaja en ciudades grandes, considera que el nivel de aceptación
de su producto en los hogares de la ciudad 1 es de un 35% y en la ciudad 2 de un
30%. Si se toma una muestra aleatoria de 400 hogares de cada ciudad. ¿Cuál es la
probabilidad que la diferencia de proporciones muestrales de hogares que prefieren el
producto en ambas ciudades sea menor al 8%? Interpretar el resultado.
Solución.-
P1 = 0.35 = proporción de hogares que prefiere el producto en la ciudad 1.
Q1 = 1 – P1 = 0.65 = proporción de hogares que no prefiere el producto en la ciudad
1.
P2 = 0.30 = proporción de hogares que prefiere el producto en la ciudad 2.
Q2 = 1 – P2 = 0.70 = proporción de hogares que no prefiere el producto en la ciudad
2.
n1 = n2 = 400 hogares (tamaño de la muestra en ambas ciudades)
Considerando que ambas ciudades son grandes y que las correspondientes fracciones
de muestreo son menores al 5% (f = n / N < 0.05) se tiene que:
p1 – p2 ~ N(P1 – P2 , 2
21 pp )
Con media: 2121
PPpp = 0.35 – 0.30 = 0.05
Y varianza: 2
21 pp =
1
11
n
QP
+
2
22
n
QP
=
400
)65.0)(35.0(
400
)65.0)(35.0(
= 0.0011 .
Luego:
p1 – p2 ~ N(0.05 ; 0.0011) y
0331.0
05.0)( 212121
21
ppPPpp
Z
pp
~ N(0 , 1)
51. 51
Se pide calcular:
P (p1 – p2 0.08 ) = P(-0.08 p1 – p2 0.08) =
=
0331.0
05.008.0
0331.0
05.0
0331.0
05.008.0 21 pp
P =
= P(-3.93 Z 0.91) = (0.91) - (-3.93) =
= 0.81859 – 0.00004 = 0.81855 Rpta.
Interpretación.- en el 81.86% de las comparaciones, para muestras de 400 hogares
de cada ciudad, las diferencias de proporciones muestrales de hogares que
prefieren el producto en ambas ciudades será menor al 8%.
52. 52
2.7 EJERCICIOS RESUELTOS
1. Si se toma una muestra aleatoria de tamaño n, de una población X con
distribución Bernoulli, con parámetro p, hallar la función de probabilidad conjunta
(o de verosimilitud) para dicha muestra.
Solución
Si la variable aleatoria. X ~ Bernoulli (p), entonces cada Xi ~ Bernoulli (p) y su
función de probabilidad es: 1
( ) , 1,2,....,i ix x
X if x p q i n
; xi = 0 y 1.
Luego la función de probabilidad conjunta o de verosimilitud será:
1 2 1 2( , ,...., ) ( ) ( ).... ( )n X X X nf x x x f x f x f x 1 1x x
p q
2 2x x
p q .... n nx x
p q
= 1 1
n n
i i
i i
x n x
p q
, xi = 0 y 1; i = 1, 2, .... , n . Rpta.
2. Si se toma una muestra aleatoria de tamaño m, de una población X con
distribución binomial, con parámetros n y p, hallar la función de probabilidad
conjunta (o de verosimilitud) para dicha muestra.
Solución
Como la variable aleatoria X ~ B(n, p), entonces cada Xi ~ B(n, p) y su función
de probabilidad es: ( ) , 1,2,....,i i
xi
x n x
X i nf x C p q i m
; xi = 0, 1, 2, 3, .... , n
Luego la función de probabilidad conjunta o de verosimilitud será:
1 2 1 2( , ,...., ) ( ) ( ).... ( )n X X X nf x x x f x f x f x
= 1 1
1
x n x
n xC p q
2 2
2
x n x
n xC p q
.... m m
m
x n x
n xC p q
= 1 1
1
m m
i i
i i
i
m x m x
n x
i
C p q
, xi = 0, 1, 2,....,n; i = 1, 2, ..., m .
Rpta.
3. Si se toma una muestra aleatoria de tamaño n, de una población X con
distribución de Pareto, con parámetro B, hallar la función de probabilidad
conjunta (o de verosimilitud) para dicha muestra.
53. 53
Solución
Si la variable aleatoria. X ~ Pareto (B), entonces cada Xi ~ Pareto (B) y su función de
probabilidad es:
0
01
( ) , , 1,2,....,
B
X i iB
i
BX
f x X X i n
X
. Donde:
B = Coeficiente de Pareto > 0.
Xo = Ingreso mínimo.
Luego la función de probabilidad conjunta o de verosimilitud será:
1 2 1 2( , ,...., ) ( ) ( ).... ( )n X X X nf x x x f x f x f x
0
1
1
B
B
BX
X
0
1
1
B
B
BX
X
....
0
1
1
B
B
BX
X
0
0
1
1
; , 1,2,....,
n nB
in
B
i
i
B X
X X i n
X
, Rpta.
4. Si se toma una muestra aleatoria de tamaño n, de una población X con distribución
log-normal, con parámetros μ y σ2
, hallar la función de probabilidad conjunta (o de
verosimilitud) para dicha muestra.
Solución
Como la variable aleatoria X ~ LN (μ , σ2
), entonces cada Xi ~ LN (μ , σ2
) y su
función de probabilidad esta dada por:
2 2
(ln ) /2
2
1
( ) ; 0,
2
ix
X i i
i
f x e x
x
i =
1, 2, ...., n.
Luego la función de densidad conjunta o de verosimilitud será:
1 2 1 2( , ,...., ) ( ) ( ).... ( )n X X X nf x x x f x f x f x
=
2 2
1(ln ) /2
2
1
1
2
x
e
x
2 2
2(ln ) /2
2
2
1
2
x
e
x
....
2 2
(ln ) /2
2
1
2
nx
n
e
x
=
=
2 2
1
(ln ) /22
2
1
1 1
; 0,
2
n
i
i
n
x
in
i
i
e x
x
i = 1, 2, 3, .... , n. Rpta.
54. 54
5. Las botellas de aceite para motor de carros tienen un contenido medio de 2.0 litros
y una desviación estándar de 0.12 litros. Si se toma una muestra aleatoria de 36
botellas, Calcule e interprete la probabilidad que:
a) Las botellas tengan una media de llenado entre 1.96 y 2.03 litros.
b) ¿Dentro de qué límites simétricos caerá el 95 % de las medias muestrales
alrededor de la media poblacional?
Solución
Los datos del problema son: μ = 2.0 lts., σ = 0.12 lts. y n = 36 botellas.
n
XVarX
2
2
)(
= (0.12)2
/ 36 = 0.0004 X
0.02 lts.
Luego: 2
( , )X
X N = N(2.00, 0.0004) y
( 2.00)
(0,1)
0.02
X
Z N
. Nos piden:
a) P(1.96 X 2.03) =
1.96 2.00 2.00 2.03 2.00
0.02 0.02 0.02
X
P
= P(-2.0 Z
1.5)
= (1.5) - (-2.0) =
= 0.93319 – 0.02275 = 0.91044 Rpta.
20
15
10
5
0
X = media muestral
Densidad
1.96
0.9104
2.032.00
Distribución contenido medio de aceite
Normal, Media=2, Desv.Est.=0.02 lts.
Resultado gráfico en Minitab
55. 55
Interpretación.- en el 91.04% de las (ó en 9104 de cada 10000) muestras de 36
botellas de aceite para motor de carro de dos litros, el contenido medio está entre
1.96 y 2.03 litros.
b) Sean 2.00 – E y 2.00 + E los límites simétricos alrededor de la media μ = 2.0 lts.,
dentro de los cuales estará el 95 % de las X . Entonces:
0.95 = P(2.00 – E X 2.00 + E) = ( )
0.02 0.02
E E
P Z
= 2 1 0.975
0.02 0.02 0.02 0.02
E E E E
0.975
0.02
E
Z = 1.96 → E = 1.96 x 0.02 = 0.039 lts. Luego los límites serán:
2.00 – E = 2.00 – 0.039 = 1.961 lts. y 2.00 + 0.039 = 2.039 lts. Es decir:
0.95 = P(1.961 X 2.039) Rpta.
Interpretación.- en el 95% de las (ó en 9500 de cada 10000) muestras de 36
botellas de aceite para motor de carro de dos litros, el contenido medio está entre
1.961 y 2.039 lts. alrededor de μ = 2.0 lts.
6. Una estación de servicio de una ciudad grande ha encontrado que sus ventas
semanales de petróleo tienen un promedio de 15 galones por cliente con una
desviación estándar de 2.8. Para una muestra aleatoria de 49 clientes, calcule e
interprete:
a) La probabilidad de que la compra promedio semanal de petróleo sea menor de
14 galones;
b) ¿Dentro de qué límites simétricos caerá el 99% de las medias muestrales
alrededor de la media poblacional?
Solución
Los datos del problema son: μ = 15 glns., σ = 2.8 glns. y n = 49 clientes.
n
XVarX
2
2
)(
= (2.8)2
/ 49 = 0.16 X
0.4 glns.
56. 56
Entonces: 2
( , )X
X N = N(15, 0.16) y
( 15)
0.4
X
Z
N(0, 1). Nos piden:
a) P( X < 14) =
15 14 15
0.4 0.4
X
P
= P(Z < -2.5) = (-2.5) = 0.00621 Rpta.
Interpretación.- en el 0.621% de las (ó en 62 de cada 10000) muestras de 49
clientes de petróleo, la compra media es menor a 14 galones.
b) Sean 15 – E y 15 + E los límites simétricos alrededor de la media μ = 15
glns., dentro de los cuales caerá el 99 % de las X . Entonces:
0.99 = P(15 – E X 15 + E) = ( )
0.4 0.4
E E
P Z
= 2 1 0.995
0.4 0.4 0.4 0.4
E E E E
0.995
0.4
E
Z = 2.575 → E = 2.575 x 0.4 = 1.03 glns. Luego los límites serán:
15 – E = 15 – 1.03 = 13.97 glns. y 15 + 1.03 = 16.03 glns. Es decir:
0.99 = P(13.97 X 16.03) Rpta.
1.0
0.8
0.6
0.4
0.2
0.0
X = media muestral
Densidad
13.97
0.99
16.0315
Normal, Media=15, Desv.Est.=0.4
Distribución compra media de petróleo
Resultado gráfico en Minitab
57. 57
Interpretación.- en el 99% de las (ó en 9900 de cada 10000) muestras de 49
clientes de petróleo, la venta media se encuentra entre 13.97 y 16.03 glns.
alrededor de μ = 15 glns.
7. La compañía “Yapatera” vende bolsas de azúcar con un contenido medio de 5
kilos y una desviación estándar de 0.2 kilos. Si se toma muestras al azar de 36
bolsas. Calcule e interprete:
a) La probabilidad de que el peso medio de la muestra supere los 5.1 kilos.
b) ¿Dentro de que límites simétricos alrededor de la media poblacional caerá el
90% de los pesos medios muestrales?
Solución
Los datos del problema son: μ = 5 Kg., σ = 0.2 Kg. y n = 36 bolsas.
n
XVarX
2
2
)(
= (0.2)2
/ 36 = 0.0011 X
0.033 Kg.
Entonces: 2
( , )X
X N = N(5, 0.0011) y
( 5)
0.033
X
Z
N(0, 1). Se pide:
a) P( X > 5.1) =
5 5.1 5
0.033 0.033
X
P
= P(Z > 3.03) = 1 - (3.03) =
= 1 - 0.99878 = 0.00122 Rpta.
Interpretación.- en el 0.12% de las (ó en 12 de cada 10000) muestras de 36 bolsas
de azúcar, el peso medio supera los 5.1 kilos.
b) Sean 5 – E y 5 + E los límites simétricos alrededor de la media μ = 5 Kg.,
dentro de los cuales caerá el 90 % de las X . Entonces:
0.90 = P(5 – E X 5 + E) = ( )
0.033 0.033
E E
P Z
= 2 1 0.95
0.033 0.033 0.033 0.033
E E E E
0.95
0.033
E
Z = 1.645 → E = 1.645 x 0.033 = 0.054 Kg. Luego los límites serán:
58. 58
5 – E = 5 – 0.054 = 4.946 Kg. y 5 + 0.054 = 5.054 Kg. Es decir:
0.90 = P(4.946 X 5.054) Rpta.
Interpretación.- en el 90% de las (ó en 9000 de cada 10000) muestras de 36
bolsas de azúcar, el contenido medio se encuentra entre 4.946 y 5.054 Kg.
alrededor de μ = 5 Kg.
8. En Lima el precio promedio al consumidor del kilo de arroz es μ = S/. 3.20 con
una desviación estándar σ = S/. 0.25. Si se selecciona una muestra aleatoria de 100
consumidores de arroz, calcule e interprete:
a) La probabilidad que el precio medio muestral del arroz sea mayor a S/. 3.25 el
kilo.
b) ¿Dentro de que límites simétricos caerá el 95% de los precios medios
muestrales alrededor de la media poblacional?
Solución
Los datos del problema son: μ = S/. 3.20, σ = S/. 0.25. y n = 100 consumidores.
n
XVarX
2
2
)(
= (0.25)2
/ 100 = 0.000625 X
S/. 0.025
Entonces: 2
( , )X
X N = N(3.20, 0.000625) y
( 3.20)
0.025
X
Z
N(0, 1). Se
pide:
a) P( X > 3.25) =
3.20 3.25 3.20
0.025 0.025
X
P
= P(Z > 2.0) = 1 - (2.00) =
= 1 - 0.97725 = 0.02275 Rpta.
Interpretación.- en el 2.28% de las (ó en 228 de cada 10000) muestras de 100
consumidores de arroz, el precio medio del kilo es mayor a S/. 3.25.
b) Sean 3.20 – E y 3.20 + E los límites simétricos alrededor de la media μ = S/.
3.20, dentro de los cuales caerá el 95 % de las X . Entonces:
0.95 = P(3.20 – E X 3.20 + E) = ( )
0.025 0.025
E E
P Z
59. 59
= 2 1 0.975
0.025 0.025 0.025 0.025
E E E E
0.975
0.025
E
Z = 1.96 → E = 1.96 x 0.025 = S/. 0.05. Luego los límites serán:
3.20 – E = 3.20 – 0.05 = S/. 3.15 y 3.20 + 0.05 = S/. 3.25. Es decir:
0.95 = P(3.15 X 3.25) Rpta.
Interpretación.- en el 95% de las (ó en 9500 de cada 10000) muestras de 100
consumidores de arroz, el precio medio del kilo se encuentra entre 3.15 y 3.25
nuevos soles alrededor de μ = S/. 3.20.
9. La compañía “La negrita” vende latas de café con un contenido medio de 195
gramos y una desviación estándar de 6 gramos. Si se toman muestras al azar de 25
latas. Calcule e interprete:
a) La probabilidad de que el peso medio de la muestra sea menor de 192
gramos.
b) ¿Dentro de que límites simétricos alrededor de la media poblacional caerá el
99.73% de los pesos medios muestrales?
Solución
Los datos del problema son: μ = 195 gr., σ = 6 gr. y n = 25 latas.
n
XVarX
2
2
)(
= (6)2
/ 25 = 1.44 X
1.2 gr.
Entonces: 2
( , )X
X N = N(195, 1.44) y
( 195)
1.2
X
Z
N(0, 1). Se pide:
a) P( X < 192) =
195 192 195
1.2 1.2
X
P
= P(Z < -2.5) = (-2.50) = 0.00621
Interpretación.- en el 0.62% de las (ó en 62 de cada 10000) muestras de 25
latas de café, el peso medio es menor 192 gr.
b) Sean 195 – E y 195 + E los límites simétricos alrededor de la media μ = 195
gr, dentro de los cuales caerá el 99.73 % de las X . Entonces:
60. 60
0.9973 = P(195 – E X 195 + E) = ( )
1.2 1.2
E E
P Z
= 2 1 0.99865
1.2 1.2 1.2 1.2
E E E E
0.99865
1.2
E
Z = 3.0 → E = 3 x 1.2 = 3.6 gr. Luego los límites serán:
195 – E = 3.6 – 0.05 = 191.4 gr. y 195 + 3.6 = 198.6 gr. Es decir:
0.9973 = P(191.4 X 198.6) Rpta.
Interpretación.- en el 99.73% de las (ó en 9973 de cada 10000) muestras de 25
latas de café, el peso medio se encuentra entre 191.4 y 198.6 gr. alrededor de μ =
195 gr.
10. Se sabe que en la ciudad A el gasto medio mensual en arbitrios es de S/. 250, con
una desviación típica de S/. 60; mientras que en la ciudad B dicho gasto medio
mensual es de S/. 235, con una desviación típica de S/. 50. En una auditoría para
determinar el gasto medio mensual en arbitrios en las ciudades A y B, se toma una
muestra al azar de 300 hogares de cada ciudad. Calcule e interprete la
probabilidad de que:
a) El gasto medio mensual en arbitrios en la ciudad B sea mayor que en la ciudad
A.
b) El gasto medio mensual en arbitrios en la ciudad A sea al menos S/. 25 más
que el gasto medio mensual en arbitrios en la ciudad B.
Solución
Los datos del problema son: μA = S/. 250, σA = S/. 35 y nA = 300 hogares.
μB = S/. 235, σA = S/. 20 y nB = 300 hogares. Luego:
2 2
2 (60)
( )
300A
A
AX
A
Var X
n
= 12.00 y
2 2
2 (50)
( )
300B
B
BX
B
Var X
n
= 8.33
61. 61
A B A BX X
= 250 - 235 = 15, 2 2 2
A BA B x xX X
= 12 + 8.33 = 20.33 y
A BX X
= 4.51. Luego:
2
( , )A BA B A B X X
X X N
= N(15, 20.33) y
( 15)
4.51
A BX X
Z
N(0, 1).
Se pide:
a) P( BX > AX ) = P( AX < BX ) = P( AX - BX < 0) =
( 15) 0 15
4.51 4.51
A BX X
P
=
= P(Z < -3.33) = (-3.33) = 0.00043 Rpta.
Interpretación.- en el 0.04% de las (ó en 4 de cada 10000) muestras de 300
hogares de cada ciudad, el gasto medio mensual en arbitrios en la ciudad B será
mayor que en la ciudad A.
b) 25A BP X X = 1 - 25A BP X X = 1 -
15 25 15
4.51 4.51
A BX X
P
=
= 1 – P(Z < 2.22) = 1 - (2.22) =
= 1 – 0.98679 = 0.01321 Rpta.
Interpretación.- en el 1.32% de las (ó en 132 de cada 10000) muestras de 300
hogares de cada ciudad, el gasto medio mensual en arbitrios en la ciudad A
será al menos S/. 25 más que el gasto medio mensual en arbitrios en la ciudad
B.
11. Dos fábricas A y B productoras de bombillas afirman que el promedio de
duración de ellas es de 1980 y 1950 horas, respectivamente, con desviaciones
típicas de 90 y 100 horas. Si se seleccionan 100 bombillas al azar de cada fábrica,
calcule e interprete la probabilidad de que:
a) Las bombillas B tengan una duración media menor de 1930 horas.
b) Las bombillas B tengan una duración media mayor que la duración media de
las bombillas A.
62. 62
Solución
Los datos del problema son: μA = 1980 horas, σA = 90 horas y nA = 100 bombillas.
μB = 1950 horas, σB = 100 horas y nB = 100 bombillas. Luego:
2
2
( )A
A
AX
A
Var X
n
= (90)2
/ 100 = 81 y
2
2
( )B
B
BX
B
Var X
n
= (100)2
/ 100 =
100
a) 2
( , )BB B X
X N = N(1950, 81) y
( 1950)
9
BX
Z
N(0, 1). Se pide:
P( BX < 1930) =
1950 1930 1950
9 9
BX
P
= P(Z < -2.22) =
= (-2.22) = 0.01321 Rpta.
Interpretación.- en el 1.32% de las (ó en 132 de cada 10000) muestras de 100
bombillas B, la duración media menor de 1930 horas.
b) A B A BX X
= 1980 - 1950 = 30, 2 2 2
A BA B x xX X
= 81 + 100 = 181 y
A BX X
= 13.45. Luego:
2
( , )A BA B A B X X
X X N
= N(30, 181) y
( 30)
13.45
A BX X
Z
N(0,
1). Se pide:
P( BX > AX ) = P( AX < BX ) = P( AX - BX < 0) =
( 30) 0 30
13.45 13.45
A BX X
P
=
= P(Z < -2.23) = (-2.23) = 0.01287 Rpta.
Interpretación.- en el 1.29% de las (ó en 129 de cada 10000) muestras de 100
bombillas A y 100 bombillas B, la duración media de las bombillas B es mayor
que la duración media de las bombillas A.
12. Un proceso automático es realizado por dos máquinas que empaquetan un
producto en bolsas de 500 gramos. La máquina 1 llena con una desviación
estándar de 15 gramos y la máquina 2 de 20 gramos. Si se seleccionan muestras
de 100 bolsas de cada máquina, calcule e interprete la probabilidad de que:
a) El llenado medio de la máquina 1 sea menor que el llenado medio de la máq.
2.
63. 63
b) Las medias muestrales difieran en menos de 2 gramos.
Solución
Los datos del problema son: μ1 = 500 gr., σ1 = 15 gr. y n1 = 100 bolsas.
μ2 = 500 gr., σ2 = 20 gr. y n2 = 100 bolsas. Luego:
1
2
2 1
1
1
( )X
Var X
n
= (15)2
/ 100 = 2.25 y 2
2
2 2
2
2
( )X
Var X
n
= (20)2
/ 100 = 4.
1 2 1 2X X
= 500 - 500 = 0, 1 21 2
2 2 2
x xX X
= 2.25 + 4 = 6.25 y
A BX X
= 2.5. Luego:
1 2
2
1 2 1 2( , )X X
X X N
= N(0, 6.25) y 1 2( 0)
2.5
X X
Z
N(0, 1). Se pide:
a) P( 1X < 2X ) = P( 1X - 2X < 0) = 1 2( 0) 0 0
2.5 2.5
X X
P
=
= P(Z < 0) = (0) = 0.5000 Rpta.
Interpretación.- en el 50% de las (ó en 5000 de cada 10000) muestras de 100
bolsas de la máquina 1 y 100 bolsas de la máquina 2, el llenado medio de la
máquina 1 es menor que el llenado medio de la máquina 2.
b) 1 2 2P X X = 1 22 2P X X = 1 2 02 0 2 0
2.5 2.5 2.5
X X
P
=
= P(-0.80 < Z < 0.80) = 2 (0.80) - 1 =
= 2 (0.78814) – 1 = 0.57628 Rpta.
Interpretación.- en el 57.63% de las (ó en 5763 de cada 10000) muestras de
100 bolsas de cada máquina, las medias muestrales difieren en 2 gramos.
13. Según un estudio del Ministerio de Salud,2
en el Perú los varones de 9 años de
edad tienen un peso promedio de 26.8 Kg. y una desviación estándar de 2.5 Kg.,
mientras que las mujeres tienen un peso promedio de 26.7 Kg. y una desviación
estándar de 3.8 Kg. Si se toman independientemente dos muestras al azar sin
reposición, de n = 300 niños y m = 300 niñas. Calcule e interprete la probabilidad
de que:
2
Ministerio de Salud. Informe del estado nutricional en el Perú. Componente nutricional ENAHO-CENAN Julio 2009 – Junio 2010,
CENAN – INEI,.. Lima, Perú, 2011.
64. 64
a) El peso promedio de los niños sea menor que el peso promedio de las niñas.
b) El peso promedio de los niños sea al menos 0.6 kg. más que el peso promedio
de las niñas.
Solución
Los datos del problema son: μv = 26.8 Kg., σv = 2.5 Kg. y nv = 300 niños.
μm = 26.7 Kg., σm = 3.8 Kg. y nm = 300 niñas. Luego:
2
2
( )v
v
vX
v
Var X
n
= (2.5)2
/ 300 = 0.02083 y
2
2
( )m
m
mX
m
Var X
n
= (3.8)2
/ 300 = 0.04813.
v m v mX X
= 26.8 – 26.7 = 0.1, 2 2 2
v mv m x xX X
= 0.06896 y
v mX X
= 0.2626. Luego:
2
( , )v mv m v m X X
X X N
= N(0.1, 0.2626) y
( 0.1)
0.2626
v mX X
Z
N(0,
1). Se pide:
a) P( vX < mX ) = P( vX - mX < 0) =
( 0.1) 0 0.1
0.2626 0.2626
v mX X
P
=
= P(Z < -0.38) = (-0.38) = 0.35197 Rpta.
Interpretación.- en el 35.2% de las (ó en 3520 de cada 10000) muestras de 300
niños y 300 niñas peruanos de 9 años de edad, el peso promedio de los niños
es menor que el peso promedio de las niñas.
b) 0.6v mP X X = 1 - 0.6v mP X X = 1 -
0.1 0.6 0.1
0.2626 0.2626
v mX X
P
=
= 1 – P(Z < 1.90) = 1 - (1.90) =
= 1 – 0.97128 = 0.02872 Rpta.
Interpretación.- en el 2.87% de las (ó en 287 de cada 10000) muestras de 300
niños y 300 niñas peruanos de 9 años de edad, el peso promedio de los niños
será al menos 0.6 kg. más que el peso promedio de las niñas.
14. Una empresa azucarera embolsa azúcar con un contenido medio de 50 kg. y
desviación estándar de 0.5 kg. Para el control de calidad se toman muestras
65. 65
aleatorias de 25 bolsas de la producción diurna y 50 de la producción nocturna.
Calcule e interprete la probabilidad de que la producción media de las bolsas de
ambos turnos difieran en menos de 0.2 kg.
Solución
Los datos del problema son: μ1 = 50 Kg., σ1 = 0.5 Kg. y n1 = 25 bolsas.
μ2 = 50 Kg., σ2 = 0.5 Kg. y n2 = 50 bolsas. Luego:
1
2
2 1
1
1
( )X
Var X
n
= (0.5)2
/ 25 = 0.01 y 2
2
2 2
2
2
( )X
Var X
n
= (0.5)2
/ 50 =
0.005
1 2 1 2X X
= 50 - 50 = 0, 1 21 2
2 2 2
x xX X
= 0.010 + 0.005 = 0.015 y
A BX X
= 0.1225. Luego:
1 2
2
1 2 1 2( , )X X
X X N
= N(0, 0.015) y 1 2( 0)
0.1225
X X
Z
N(0, 1). Se
pide:
1 2 0.2P X X = 1 20.2 0.2P X X =
= 1 2 00.2 0 0.2 0
0.1225 0.1225 0.1225
X X
P
=
= P(-1.63 < Z < 1.63) = 2 (1.63) - 1 =
= 2 (0.94845) – 1 = 0.8969 Rpta.
Interpretación.- en el 89.69% de las (ó en 8969 de cada 10000) muestras de 25
bolsas de la producción diurna y 50 de la producción nocturna, la producción
media de las bolsas de ambos turnos difieren en menos de 0.2 kg.
15. En las tiendas Metro el 70 % de las compras es en alimentos y bebidas. Si se
seleccionan muestras aleatorias de 200 compras. Calcule e interprete:
a) La probabilidad de que el porcentaje de compras en alimentos y bebidas sea
mayor al 80%.
b) ¿entre que límites simétricos alrededor del verdadero porcentaje de compras
en alimentos y bebidas caerá el 99% de los porcentajes muestrales?
Solución
Los datos del problema son: P = 0.70 = proporción de las compras en alimentos y
bebidas en las tiendas Metro, Q = 0.30, n = 200 compras = tamaño de la muestra.
66. 66
Asumiendo un número muy grande de compradores, entonces, la proporción muestral:
1
,
n
i
i
X
X PQ
p N P
n n n
= N(0.70; 0.00105) y
0.70 0.70
0.03240.00105
p P p p
Z
PQ
n
~ N(0, 1). Se pide calcular:
a) P (p > 0.80 ) = 1 - P (p ≤ 0.80 ) = 1 -
0.70 0.80 0.70
0.0324 0.0324
p
P
= 1 - P(Z 3.09) = 1 - (3.09) = 1- 0.9990 = 0.0010 Rpta.
Interpretación.- en el 0.10 % de las (ó en 10 de cada 10000) muestras de 200
compras en las tiendas Metro, el porcentaje de compras en alimentos y bebidas es
mayor al 80%.
b) Sean 0.70 – E y 0.70 + E los límites simétricos alrededor de la proporción
verdadera P = 0.70, dentro de los cuales estará el 99 % de las p (proporciones
muestrales). Entonces:
0.99 = P(0.70 – E p 0.70 + E) = ( )
0.0324 0.0324
E E
P Z
=
= 2 1 0.995
0.0324 0.0324 0.0324 0.0324
E E E E
0.995 2.575 2.575(0.0324) 0.083
0.0324
E
Z E . Luego los límites serán:
0.70 – E = 0.70 – 0.083 = 0.617 y 0.70 + 0.083 = 0.783. Es decir:
0.99 = P(0.617 p 0.783) Rpta.
Interpretación.- en el 99% de las (ó en 9900 de cada 10000) muestras de 200
compras en las tiendas Metro, el porcentaje de compras en alimentos y
bebidas se encuentra entre 61.7% y 78.3% alrededor de la proporción
verdadera P = 0.70.
16. El 40% de los clientes de las tiendas Saga son varones. Si se toma una muestra
aleatoria de 200 clientes. Calcule e interprete:
a) La probabilidad que el porcentaje de clientes varones esté entre 36% y 45%.