SlideShare una empresa de Scribd logo
1 de 409
Descargar para leer sin conexión
1
UNIVERSIDAD NACIONAL DEL CALLAO
VICERECTORADO DE INVESTIGACIÓN
FACULTAD DECIENCIAS ECONÓMICAS
TEXTODEPROBLEMASDE
INFERENCIAESTADÍSTICA
AUTOR:
JUANFRANCISCOBAZÁNBACA
(Resolución Rectoral 940-2011-R del 22-9-11)
01-09-11 al 31-08-13
CALLAO – PERÚ
2013
2
ÍNDICE
Pág.
INDICE 2
INTRODUCCIÓN 5
Capítulo 1. LA DISTRIBUCIÓN NORMAL Y EL TEOREMA DEL LÍMITE
CENTRAL 6
1.1 Distribución normal 6
1.2 Distribución normal estándar 7
1.3 Propiedad reproductiva de la distribución normal 9
1.4 Teorema del límite central 10
1.5 Ejercicios resueltos 13
1.6 Ejercicios propuestos 29
Capítulo 2. DISTRIBUCIONES MUESTRALES 33
2.1 Distribución muestral de la media 37
2.2 Distribución muestral del total (conocida la media) 39
2.3 Distribución de la diferencia de medias muestrales 40
2.4 Distribución muestral de la proporción 43
2.5 Distribución muestral del total (conocida la proporción) 47
2.6 Distribución muestral de la diferencia de proporciones 48
2.7 Ejercicios resueltos 52
2.8 Ejercicios propuestos 73
Capítulo 3. DISTRIBUCIONES ESPECIALES 77
3.1 Distribución Chi-cuadrado 77
3.2 Distribución t de student 86
3.3 Distribución muestral de la media (n < 30) 92
3.4 Distribución de la diferencia de medias muestrales con varianzas
desconocidas pero iguales 93
3.5 Distribución F de Snedecor 94
3.6 Distribución de la razón de dos varianzas muestrales 98
3.7 Ejercicios resueltos 100
3
3.8 Ejercicios propuestos 119
Capítulo 4. ESTIMACIÓN PUNTUAL 122
4.1 Estimadores. Propiedades 123
4.2 Métodos de Estimación Puntual 130
4.3 Método de Máxima Verosimilitud 130
4.4 Método de los Momentos 132
4.5 Método de los mínimos cuadrados 133
4.6 Ejercicios resueltos 135
4.7 Ejercicios propuestos 152
Capítulo 5. ESTIMACIÓN POR INTERVALOS DE CONFIANZA 155
5.1 Intervalo de confianza para la media y tamaño de muestra 160
5.2 Intervalo de confianza para el total (conocida la media) 162
5.3 Intervalo de confianza para la proporción y tamaño de muestra 164
5.4 Intervalo de confianza para el total (conocida la proporción) 167
5.5 Intervalo de confianza para la diferencia de medias 168
5.6 Intervalo de confianza para la diferencia de proporciones 170
5.7 Intervalo de confianza para la media (n < 30) 173
5.8 Intervalo de confianza para la varianza 175
5.9 Intervalo de confianza para la razón de varianzas 177
5.10 Intervalo de confianza para la diferencia de medias (n y m <30) 179
5.11 Ejercicios resueltos 187
5.12 Ejercicios propuestos 235
Capítulo 6. CONTRASTE DE HIPÓTESIS ESTADÍSTICAS PARAMÉTRICAS 245
6.1 Prueba de hipótesis para la media (con varianza conocida) 251
6.2 Prueba de hipótesis para la media (con varianza desconocida) 258
6.3 Prueba de hipótesis acerca de una varianza 263
6.4 Prueba de hipótesis para la razón de varianzas 270
6.5 Prueba de hipótesis acerca de dos medias (varianzas conocidas) 276
6.6 Prueba de hipótesis acerca de dos medias (varianzas desconocidas) 281
6.7 Prueba de hipótesis para la proporción 290
4
6.8 Prueba de hipótesis para la diferencia de proporciones 293
6.9 Ejercicios resueltos 299
6.10 Ejercicios propuestos 348
Capítulo 7. PRUEBA DE HIPÓTESIS NO PARAMÉTRICAS 355
7.1 Uso de la distribución Chi-cuadrado. Test de independencia 356
7.2 Test de bondad de ajuste 362
7.3 Test de Wilcoxon 364
7.4 Test de signos 367
7.5 Test de la mediana 374
7.6 Ejercicios resueltos 379
7.7 Ejercicios propuestos 395
REFERENCIAS BIBLIOGRÁFICAS 398
Apéndice 400
Tabla 1. Distribción acumulativa normal estándar 401
Tabla 2. Distribución acumulativa chi-cuadrado 403
Tabla 3. Distribución acumulativa T de student 407
Tabla 4. Distribución acumulativa F 408
Tabla 5. De Wilcoxon para n ≤ 40 y  = 0.05 o 0.01 409
Tabla 6. Valores críticos para la prueba del signo S 409
5
INTRODUCCIÓN
La ciencia económica para poder realizar las mediciones económicas recurre
permanentemente a la inferencia estadística, ya que las deducciones y conjeturas
económicas acerca de los parámetros están basadas en muestras aleatorias tratadas
por esta disciplina.
Con el propósito de poder contribuir al proceso de enseñanza aprendizaje de la
estadística para economistas en la Universidad Nacional del Callao (UNAC),
hemos creído conveniente elaborar un “Texto de problemas de inferencia
estadística” que de manera sencilla ayude a estudiantes de la especialidad a
desarrollar competencias conceptuales y procedimentales, mediante la asimilación
de la terminología propia de la estadística, así como las correspondientes
aplicaciones a la economía.
El texto consta de siete capítulos. En el primero, se desarrolla la distribución
normal y el teorema del límite central; el capítulo dos, presenta las distribuciones
muestrales para muestras grandes (n ≥ 30) y en el capítulo tres, se desarrollan las
distribuciones muestrales especiales ligadas a muestras pequeñas (n < 30) como la
chi-cuadrado, t de student y F.
En los capítulos cuatro y cinco se desarrollan los temas relacionados a la
estimación puntual y la estimación por intervalos de confianza respectivamente.
En el capítulo seis, se desarrollan los contrastes de hipótesis estadísticas
paramétricas, poniendo especial énfasis en la determinación del valor-P
(probabilidad mínima para rechazar la hipótesis nula) usado en los cálculos
computacionales modernos. Finalmente, en el capítulo siete se presentan las
pruebas de hipótesis no paramétricas.
Gratitud eterna a nuestra querida UNAC, por el continuo apoyo ofrecido para
alcanzar estos logros que permiten sistematizar conocimientos e incorporar temas
para la discusión en clases. El reconocimiento especial a los estudiantes de
economía de la FCE-UNAC, ya que gracias a su esfuerzo y comprensión en los
últimos años se han puesto en práctica los resultados de este modesto trabajo.
6
Capítulo 1. LA DISTRIBUCIÓN NORMAL Y EL TEOREMA
CENTRAL DEL LÍMITE
“Sólo cabe progresar cuando se piensa en grande, sólo es posible avanzar
cuando se mira lejos”. José Ortega y Gasset
CONTENIDO
1.1 Distribución normal.
1.2 Distribución normal estándar.
1.3 Propiedad reproductiva de la distribución normal.
1.4 Teorema del límite central.
1.5 Ejercicios resueltos.
1.6 Ejercicios propuestos.
1.1 DISTRIBUCIÓN NORMAL
La teoría de probabilidades nos ofrece la distribución normal como una de las
distribuciones más importantes, junto al teorema central del límite, con múltiples
aplicaciones para la inferencia estadística, sobre todo en lo concerniente a las
distribuciones muestrales. Por ello a continuación hacemos un breve repaso de la
distribución normal y la presentación del teorema central del límite.
Definición.- una variable aleatoria continua X tiene distribución normal con media
μ y varianza σ2
, si su función de densidad de probabilidad esta dada por:
2
2
( )
2
2
1
( )
2
X
f x e



 
  - ∞ < x < ∞
donde: π = 3.14159265.... y e = 2.71828184 (la base de los logaritmos
neperianos).
Notación.- una notación muy común para la distribución normal es: X ~ N(μ , σ2
)
Que se lee “la variable aleatoria X se distribuye normalmente con media μ y
varianza σ2
”.
Características geométricas.-
 La gráfica tiene forma acampanada, con centro en μ.
7
 Es una función creciente en el intervalo (- ∞ , μ).
 Es una función decreciente en el intervalo (μ , ∞).
 Tiene sus puntos de inflexión en μ – σ y μ + σ.
Características estadísticas.-
 Media: E (X) = μ
 Varianza: V (X) = σ2
 Si X ~ N(μ , σ2
). Entonces, la variable aleatoria Y = a + b X también se
distribuye normalmente con media: E(Y) = a + bμ y varianza: V(Y) = b2
σ2
. Es decir: Y ~ N(a + bμ , b2
σ2
)
 Si X ~ N(μ , σ2
) el cálculo de probabilidades se efectúa realizando el
proceso de estandarización siguiente:
Z = (X - μ ) / σ ~ N(0, 1) y decimos que la v.a. Z tiene distribución
normal estándar.
1.2 DISTRIBUCIÓN NORMAL ESTÁNDAR
Definición.- Se dice que una variable aleatoria Z, es una variable aleatoria normal
estándar, si tiene distribución normal con media cero (μ = 0) y varianza uno (σ2
=
1) y su función de densidad de probabilidades es:
2/2
2
1
)( z
ezf 


- ∞ < z < ∞
La función de distribución acumulativa de Z se denota por Φ (z) o F(z) y se calcula
así:
0
5
10
15
20
25
30
35
40
μ - 3σ μ - 2σ μ - σ μ μ + σ μ + 2σ μ + 3σ
X
DISTRIBUCIÓN NORMAL
8
Φ (z) = F(z) = P [Z  z] = 

z
t
dte 2/2
2
1

Esta probabilidad nos da el área bajo la curva normal desde - ∞ hasta el valor z.
Entonces, conocidos los valores de la media μ y la varianza σ2
de una variable aleatoria
X ~ N(μ , σ2
) utilizando el proceso de estandarización Z = (X - μ ) / σ , se puede
efectuar el cálculo de probabilidades tales como:
 P[a  X  b] = P[ (a - μ ) / σ  (X - μ ) / σ  (b - μ ) / σ ]
= P[ (a - μ ) / σ  Z  (b - μ ) / σ ]
= Φ [(b - μ ) / σ ] - Φ [(a - μ ) / σ ]
 P[X  a] = P[(X - μ ) / σ  (a - μ ) / σ ] = P[Z  (a - μ ) / σ ] = Φ [(a - μ ) / σ ]
 P[X > a] = 1 – P[X  a] = 1 - Φ [(a - μ ) / σ ]
Los valores de la función de distribución acumulativa normal estándar, Φ (z) o F(z),
han sido reproducidos en la Tabla 1 del Anexo utilizando la hoja de cálculo Excel.
Uso de la Tabla de la distribución normal estándar
a) Para calcular probabilidades.- en la tabla 1, conocido el valor de z, hallar Φ
(z) = F(z) = P [Z  z]. Por ejemplo, para z = 1.96, tenemos que:
Φ (1.96) = F (1.96) = P [Z  1.96] = 0.97500.
b) Para hallar valores de z.- es un proceso inverso al anterior, ya que conocida la
probabilidad Φ (z) = F (z) = P [Z  z] = α , en la tabla 1, se debe hallar el valor
de z que acumule en probabilidad α y que denotaremos como z = Zα .
Para el mismo ejemplo, sí Φ (z) = F (z) = P [Z  z] = 0.97500, esto implica
que, en la tabla 1, a la probabilidad 0.97500, le corresponde z = Z0.97500 1.96 .
Una característica importante de la distribución normal es que:
 Entre μ – σ y μ + σ se encuentra el 68.27% de las observaciones. Es decir que :
P(μ – σ  X  μ + σ) =  




 




11 ZP
X
P






= Φ (1) - Φ (-1) = 0.84134 –0.15866 = 0.68268
9
 Entre μ – 2σ y μ + 2σ se encuentra el 95.45% de las observaciones, puesto que:
P(μ – 2σ  X  μ + 2σ) =  




 


22
22
ZPZP




= Φ (2) - Φ (-2) = 0.97725 –0.02275 = 0.9545
 Entre μ – 3σ y μ + 3σ se encuentra el 99.73% de las observaciones. Es decir que:
P(μ – 3σ  X  μ + 3σ) =  




 


33
33
ZPZP




= Φ (3) - Φ (-3) = 0.99865 – 0.00135 = 0.9973
 Entre μ – 4σ y μ + 4σ se encuentra el 99.9937% de las observaciones. Es decir
que:
P(μ – 4σ  X  μ + 4σ) =  
4 4
4 4P Z P Z
     
 
    
        
= Φ (4) - Φ (-4) = 0.999968 – 0.000031 = 0.999937
 Entre μ – 5σ y μ + 5σ se encuentra el 99.999942% de las observaciones. Es decir
que:
P(μ – 5σ  X  μ + 5σ) =  
5 5
5 5P Z P Z
     
 
    
        
= Φ (5) - Φ (-5) = 0.99999971 – 0.00000029 = 0.99999942
 Entre μ – 6σ y μ + 6σ se encuentra el 99.9999998% de las observaciones. Es
decir que:
P(μ – 6σ  X  μ + 6σ) =  
6 6
6 6P Z P Z
     
 
    
        
= Φ (6) - Φ (-6) = 0.999999999 – 0.000000001 = 0.999999998
1.3 PROPIEDAD REPRODUCTIVA DE LA DISTRIBUCIÓN NORMAL
Sean X1 , X2 , .... , Xn , n variables aleatorias independientes distribuidas
normalmente con media μi y varianza σi
2
. Es decir: Xi ~ N(μi , σi
2
) i = 1, 2, 3,
.... , n . Si Y es una combinación lineal de las v.a. Xi : Y = a0 + a1 X1 + a2 X2 + .... +
an Xn . Entonces, la variable aleatoria Y ~ N [a0 +
n
i
iia
1
 , 
n
i
iia
1
22
 ]
10
Puesto que:
 μY = E(Y) = E (a0 + a1 X1 + a2 X2 + .... + an Xn ) =
= E(a0 ) + E (a1 X1 ) + E (a2 X2 ) + .... + E (an Xn ) =
= a0 + a1 E(X1 ) + a2 E(X2 ) + .... + an E(Xn ) =
= a0 + a1 μ1 + a2 μ2 + .... + an μn = a0 +
n
i
iia
1


2
Y = V(Y) = V (a0 + a1 X1 + a2 X2 + .... + an Xn ) =
= V(a0 ) + V(a1 X1 ) + V(a2 X2 ) + .... + V(an Xn ) =
= 0 + a1
2
V(X1 ) + a2
2
V(X2 ) + .... + an
2
V(Xn ) =
= a1
2
σ1
2
+ a2
2
σ2
2
+ .... + a2
n σn
2
= 
n
i
iia
1
22

1.4 TEOREMA DEL LÍMITE CENTRAL
Sean X1 , X2 , .... , Xn , n variables aleatorias independientes con media y varianza finitas
dadas por: E(Xi) = μi y V(Xi ) = σi
2
.
Si: Yn = X1 + X2 + .... + Xn = 
n
i
iX
1
, entonces bajo ciertas condiciones generales,
la variable aleatoria Zn definida por:

 

 



 n
i
i
n
i
n
i
ii
n
nn
n
X
YV
YEY
Z
1
2
1 1
)(
)(


tiene aproximadamente una distribución normal estándar N(0, 1).
Nota.-
 E(Yn ) = E (X1 + X2 + .... + Xn ) = E (X1 ) + E (X2 ) + .... + E (Xn ) =
11
= μ1 + μ2 + .... + μn = 
n
i
i
1
 .
 V(Yn ) = V (X1 + X2 + .... + Xn ) = V(X1 ) + V(X2 ) + .... + V(Xn ) =
= σ1
2
+ σ2
2
+ .... + σn
2
= 
n
i
i
1
2
 .
Observaciones.-
1. La variable aleatoria Yn = 
n
i
iX
1
(suma de v.a. independientes) puede ser
aproximada por una v.a. distribuida normalmente, cualquiera que sea la distribución
de las Xi .
2. Las condiciones generales indicadas en el teorema están referidas a que los términos
Xi tomados individualmente, contribuyen con una cantidad despreciable a la
variación de la suma, y no es probable que un simple término tenga una gran
contribución a la suma.
Una aplicación importante de estas condiciones generales del teorema central del
límite, se da en los modelos de regresión: Yi = β0 + β1 X1i + β2 X2i + .... + βk Xki + ei
Donde la variable explicada o dependiente Y es función de un conjunto de variables
explicativas o independientes (X1 , X2 , .... , Xk ) más un error e. La aplicación del
teorema central del límite se da cuando se asume que los errores ei se distribuyen
normalmente, debido a que estos errores recogen la suma de las contribuciones
despreciables de todas las variables dejadas de considerar en el modelo.
Por ejemplo, en los modelos de demanda Qi = a – b Pi + ei , se asume que las
cantidades demandadas (Q) de un bien o servicio dependen fundamentalmente del
precio (P) del bien. Efectivamente, pero existen otras variables independientes
(gastos de publicidad, precio del bien sustituto, gustos y preferencias, etc.) que
también podrían explicar dicha demanda, sin embargo, sus contribuciones a explicar
la demanda son despreciables, por lo que la suma de sus contribuciones, reflejadas en
los errores ei se aproximan a la distribución normal.
12
3. Una situación especial del teorema central del límite se presenta cuando cada Xi
tiene la misma distribución (que es el caso de la definición de muestra aleatoria,
como veremos más adelante) y que permita encontrar la distribución de una media
muestral. La propuesta es la siguiente:
Sean X1 , X2 , .... , Xn , n variables aleatorias independientes, idénticamente
distribuidas con media y varianza común y finitas dadas por: E(Xi) = μ y V(Xi ) = σ2
.
Si: Yn = X1 + X2 + .... + Xn = 
n
i
iX
1
, entonces la variable aleatoria Zn dada
por :
n
X
n
nX
YV
YEY
Z n
n
i
i
n
nn
n
/)(
)( 1











tiene aproximadamente distribución normal estándar N(0 , 1). Donde 

n
i
in X
n
X
1
1
es la media muestral de las Xi .
Nota.-
 E(Yn ) = E (X1 + X2 + .... + Xn ) = E (X1 ) + E (X2 ) + .... + E (Xn ) =
= μ + μ + .... + μ = n μ .
 V(Yn ) = V (X1 + X2 + .... + Xn ) = V(X1 ) + V(X2 ) + .... + V(Xn ) =
= σ2
+ σ2
+ .... + σ2
= n σ2
13
1.5 EJERCICIOS RESUELTOS
1. Sea Z una variable aleatoria con distribución normal estándar [Z ~ N(0, 1)]. Hallar
las probabilidades siguientes: a) P(Z > 1.13) ; b) P(1.00 < Z < 1.42) c) P(-1.5 < Z <
0.50) ; d) P(-1.65 < Z < -1.00) ; e) P(Z < -1.52) ; f) P(0 < Z < 1.25) y g)
P(-1.63 < Z < 0).
Solución.-Usando la tabla 1 del anexo se tiene:
a) P(Z > 1.13) = 1 - P(Z ≤ 1.13) = 1 – Φ(1.13) = 1 – 0.8708 = 0.1292
b) P(1.00 < Z < 1.42) = Φ(1.42) - Φ(1.00) = 0.9222 – 0.8413 = 0.0809
Para obtener los gráficos en Minitab ver Bazán, Juan (2010)
0.4
0.3
0.2
0.1
0.0
Z
Densidad
1
0.0809
1.420
En Minitab: P(1.00 < Z < 1.42)
0.4
0.3
0.2
0.1
0.0
Z
Densidad
-1.5
0.6247
0.50
P(-1.5  Z < 0.5)
c) P(-1.5  Z < 0.5) = Φ(0.50) - Φ(-1.5) = 0.6915 – 0.0668 = 0.6247
d) P(-1.65  Z  -1.00) = Φ(-1.00) - Φ(-1.65) = 0.1587 – 0.0495 = 0.1092
e) P(Z < -1.52) = Φ(-1.52) = 1 - Φ(1.52) = 1 – 0.9357 = 0.0643
f) P(0  Z  1.25) = Φ(1.25) - Φ(0) = 0.8944 – 0.5000 = 0.3944
g) P(-1.63 < Z  0) = Φ(0) - Φ(-1.63) = 0.5000 – 0.0516 = 0.4484
2. Sea Z una variable aleatoria normal estándar [Z ~ N(0, 1)]. Hallar el valor de z
para los casos siguientes: a) Φ(z) = 0.9500; b) Φ(z) = 0.9772; c) Φ(z) =
0.9987; d) el área entre –z y z es 0.95; e) el área a la izquierda de z es 0.01; y
f) el área a la derecha de z es 0.05.
14
Solución
a) Sí Φ (z) = F (z) = P [Z  z] = 0.9500, esto implica que, en la tabla 1, a la
probabilidad 0.9500, le corresponde z = Z0.9500 = 1.645 aproximadamente.
b) Sí Φ (z) = F (z) = P [Z  z] = 0.9772, esto implica que, en la tabla 1, a la
probabilidad 0.9772, le corresponde z = Z0.9772 = 2.00 aproximadamente.
c) Sí Φ (z) = F (z) = P [Z  z] = 0.9987, esto implica que, en la tabla 1, a la
probabilidad 0.9987, le corresponde z = Z0.9987 = 3.00aproximadamente.
d) Si 0.95 = P [-z  Z  z] = Φ (z) - Φ (-z) = Φ (z) – [1 - Φ (z)] = 2 Φ (z) – 1.
Entonces, Φ (z) = 0.9750 y en la tabla le corresponde a z = Z0.9750 = 1.96.
e) Si 0.01 = Φ (z) = P [Z  z], esto implica que, en la tabla 1, a la probabilidad
0.01, le corresponde z = Z0.01 = -2.33 aproximadamente.
f) Si 0.05 = P [Z ≥ z] = 1 - Φ (z), entonces Φ (z) = 0.9500 y de acuerdo a lo
visto en la parte a) de este problema le corresponde a z = Z0.9500 = 1.645.
3. El monto de las solicitudes de préstamo de los comerciantes que recibe un
Banco, está distribuido aproximadamente en forma normal con μ = S/. 10,000 y
σ = S/. 1,000. Calcule e interprete la probabilidad de que el monto del préstamo
solicitado: a) Esté entre S/. 8,500 y 12,000; b) Sea menor que S/. 8,000; c)
Mayores de que cantidad será el 20 % de los préstamos?
Solución
Sea X = monto de las solicitudes de préstamo.
Se sabe que X ~ N(10000 , 10002
), entonces Z = (X – 10000)/ 1000 ~ N(0,
1). Luego, las probabilidades solicitadas son:
a) P(8500 ≤ X ≤ 12000) =
8500 10000 10000 12000 10000
1000 1000 1000
X
P
   
   
=
= P(-1.5 ≤ Z ≤ 2.0) = Φ(2.00) - Φ(-1.50) = 0.97725 – 0.06681 = 0.91044
Rpta.
Interpretación: el 91.04% de los montos de préstamo solicitados por los
comerciantes fluctúa entre S/. 8,500 y 12,000.
15
b) P(X ≤ 8000) =
10000 8000 10000
1000 1000
X
P
  
  
=
= P(Z ≤ -2.0) = Φ(-2.00) = 0.02275 Rpta.
Interpretación: el 2.28% (ó en 228 de cada 10000 solicitudes) de los montos
de préstamo solicitados por los comerciantes es menor a S/. 8,000.
0.0004
0.0003
0.0002
0.0001
0.0000
X = monto del préstamo
Densidad
8000
0.0228
10000
Normal, Media=10000, Desv.Est.=1000
Distribución del monto de préstamo
Resultado gráfico en Minitab
c) Sea C la cantidad de préstamo buscada, entonces:
0.20 = P(X > C) = 1 -
10000
1000
C
P Z
 
 
 
0.80 =
10000
1000
C

 
 
 
 0 . 8 0
10000
0.84
1000
C
Z

   C = S/. 10840
Rpta.
Interpretación: el 20% de los montos de préstamo solicitados por los
comerciantes es mayor a S/. 10,840.
16
0.0004
0.0003
0.0002
0.0001
0.0000
X = monto del préstamo
Densidad
10840
0.20
10000
Normal, Media=10000, Desv.Est.=1000
Distribución del monto de préstamo
4. Para cierto examen la calificación vigesimal tiene distribución normal con media
11 y desviación estándar 2. Se desea desaprobar al 40% de los examinados.
¿Cuál debe ser la calificación máxima desaprobatoria? Interprete el resultado.
Solución
Sea X = calificación vigesimal de los examinados.
Se sabe que X ~ N(11 , 22
), entonces Z = (X – 11)/ 2 ~ N(0, 1).
Sea M la máxima nota desaprobatoria buscada, entonces:
0.40 = P(X < M) =
11
2
M
P Z
 
 
 
=
11
2
M

 
 
 
 0.40
11
0.25
2
M
Z

    M = 10.5 Rpta.
Interpretación: el 40% de los examinados desaprobados tiene nota menor a 10.5.
5. Los ingresos de los trabajadores tiene distribución normal con media µ= S/.
1000 y desviación estándar σ = S/. 200. Si se selecciona a 2000 de estos
trabajadores, calcule e interprete:
a) ¿Cuántos trabajadores tienen ingreso menor a S/. 600?
b) ¿Cuántos trabajadores tienen ingreso entre S/. 850 y 1300?
Solución
17
Si X = ingreso de los trabajadores ~ N(1000, 2002
), Z = (X – 1000)/ 200 ~ N(0,
1).
Para determinar cuántos de los n = 2000 trabajadores tienen ingresos en los
intervalos dados, primero se determina la probabilidad P y después multiplica
por n. Se pide:
a) P = P(X < 600) =
1000 600 1000
200 200
X
P
  
 
 
= P(Z < -2.0) = Φ(-2.0) =
0.02275
Luego nP = 0.02275 x 2000 = 45.5 trabajadores Rpta.
Interpretación: 46 trabajadores (2.28%) tienen ingreso menor a S/. 600.
b) P = P(850 ≤ X ≤ 1300) =
850 1000 1000 1300 1000
200 200 200
X
P
   
   
=
= P(-0.75 ≤ Z ≤ 1.5) = Φ(1.5) - Φ(-0.75) = 0.93319 – 0.22663 = 0.70656
0.0020
0.0015
0.0010
0.0005
0.0000
X = ingreso
Densidad
850
0.7066
13001000
Normal, Media=1000, Desv.Est.=200
Distribución del ingreso
Luego nP = 0.70656 x 2000 = 1413.12 trabajadores Rpta.
Interpretación: alrededor de 1413 trabajadores (70.66%) tienen ingreso entre
S/. 850 y 1300.
6. El volumen de negociaciones diarias (en millones de nuevos soles) para las
acciones comercializadas en la bolsa de Lima tiene distribución normal con
media µ= 800 y desviación estándar σ = 100. En un período de 60 días, calcule e
interprete:
a) ¿En cuántos días el volumen de negociaciones es de 600 o menos millones?
b) ¿En cuántos días el volumen de negociaciones es mayor de 900 millones?
18
Solución
Si X = volumen diario de negociaciones en millones de S/. ~ N(800, 1002
)
 Z = (X – 800)/ 100 ~ N(0, 1).
Para determinar en cuántos de los n = 60 días el volumen de las negociaciones
está en los intervalos dados, primero se determina la probabilidad P y después
multiplica por n. Se pide:
a) P = P(X ≤ 600) =
800 600 800
100 100
X
P
  
 
 
= P(Z < -2.0) = Φ(-2.0) =
0.02275
Luego nP = 0.02275 x 60 = 1.4 días Rpta.
Interpretación: en alrededor de 1.4 días (2.28%) el volumen de
negociaciones es de 600 o menos millones de nuevos soles.
b) P = P(X > 900) =
800 900 800
100 100
X
P
  
 
 
= P(Z > 1.0) = 1 - Φ(1.0) =
= 1 – 0.84134 = 0.15866. Luego nP = 0.15866 x 60 = 9.5días Rpta.
Interpretación: en alrededor de 9.5 días (15.87%) el volumen de
negociaciones es mayor de 900 millones de nuevos soles.
7. El peso de los pernos fabricados se distribuye normalmente con media µ= 80 gr.
y desviación estándar σ = 5 gr. Si se almacenan 2000 pernos, calcule e interprete
¿qué cantidad de pernos pesan: a) menos de 70 gramos? y b) entre 75 y 90
gramos?
Solución
Si X = peso de los pernos ~ N(80, 52
)  Z = (X – 80)/ 5 ~ N(0, 1).
Para determinar cuántos de los n = 2000 pernos tienen un peso en los intervalos
dados, primero se determina la probabilidad P y después multiplica por n. Se
pide:
a) P = P(X < 70) =
80 70 80
5 5
X
P
  
 
 
= P(Z < -2.0) = Φ(-2.0) = 0.02275
Luego nP = 0.02275 x 2000 = 46 pernos Rpta.
Interpretación: alrededor de 46 pernos (2.28%) pesan menos de 70 gramos.
b) P = P(75 ≤ X ≤ 90) =
75 80 80 90 80
5 5 5
X
P
   
   
= P(-1 ≤ Z ≤ 2) =
19
= Φ(2.0) - Φ(-1.0) = 0.97725 – 0.15866 = 0.81859.
0.09
0.08
0.07
0.06
0.05
0.04
0.03
0.02
0.01
0.00
X = peso
Densidad
75
0.8186
9080
Normal, Media=80, Desv.Est.=5
Distribución del peso de los pernos
Resultado gráfico en Minitab
Luego nP = 0.81859 x 2000 = 1637 pernos Rpta.
Interpretación: alrededor de 1637 pernos (81.86%) pesan entre 75 y 90
gramos.
8. El tiempo necesario para terminar un examen se distribuye normalmente con
media µ= 80 minutos y desviación estándar σ = 10 minutos. En un curso de 60
alumnos, calcule e interprete cuántos alumnos terminan el examen:
a) ¿en una hora o menos?
b) ¿en más de 60 minutos, pero en menos de 75 minutos?
c) ¿Cuántos alumnos no terminan el examen, si éste dura 90 minutos?
Solución
Si X = tiempo para terminar un examen ~ N(80, 102
)
 Z = (X – 80)/ 10 ~ N(0, 1).
Para determinar cuántos de los n = 60 alumnos terminan el examen en los
intervalos dados, primero se determina la probabilidad P y después multiplica
por n. Se pide:
a) P = P(X ≤ 60) =
80 60 80
10 10
X
P
  
 
 
= P(Z ≤ -2.0) = Φ(-2.0) = 0.02275.
Luego nP = 0.02275 x 60 = 1.4 alumnos Rpta.
20
Interpretación: alrededor de 1.4 alumnos (2.28%) terminan el examen en una
hora o menos.
b) P = P(60 ≤ X ≤ 75) =
60 80 80 75 80
10 10 10
X
P
   
   
= P(-2 ≤ Z ≤ -0.5) =
= Φ(-0.50) - Φ(-2.0) = 0.30854 – 0.02275 = 0.28579.
Resultado gráfico en Minitab
0.04
0.03
0.02
0.01
0.00
X = tiempo duración examen
Densidad
60
0.286
75 80
Normal, Media=80, Desv.Est.=10
Distribución tiempo duración examen
Luego nP = 0.28579 x 60 = 17 alumnos Rpta.
Interpretación: alrededor de 17 alumnos (28.6%) terminan el examen en más
de 60 minutos, pero en menos de 75 minutos.
c) P = P(X > 90) =
80 90 80
10 10
X
P
  
 
 
= P(Z > 1.0) = 1 - Φ(1.0) =
= 1 – 0.84134 = 0.15866.
Luego nP = 0.15866 x 60 = 9.5 alumnos Rpta.
Interpretación: alrededor de 10 alumnos (15.87%) no terminan el examen, si
éste dura 90 minutos.
9. Suponga que el ingreso familiar mensual (X) en una comunidad tiene
distribución normal con media $400 y desviación estándar $50. Si los gastos de
consumo familiar (C) están dados por la relación C = 0.80 X + 50, ¿calcule e
interprete la probabilidad de que los gastos de consumo familiar sean inferiores a
$320?
Solución
21
Si X = ingreso familiar mensual ~ N(400, 502
),  Z = (X – 400)/ 50 ~ N(0, 1).
Se pide:
P(C < 320) = P(0.80 X + 50 < 320) = P(X < 337.5) =
=
400 337.5 400
50 50
X
P
  
 
 
= P(Z < -1.25)
= Φ(-1.25) = 0.10565 Rpta.
Otra forma de resolver es usando la propiedad reproductiva de la distribución
normal. Sí C = 0.80 X + 50, entonces la media y la varianza de C son:
 ( ) 0.8 ( ) 50 0.8(400) 50 370C E C E X      
  22 2
(0.8 50) 0.8 ( ) 0.64(2500) 1600 40C Var X Var X      
Luego C ~ N(370, 402
),  Z = (C – 370)/ 40 ~ N(0, 1). Entonces:
P(C < 320) =
370 320 370
40 40
C
P
  
 
 
= P(Z < -1.25) = Φ(-1.25) = 0.10565
Rpta.
Interpretación: el 10.6% de (ó en 1057 de cada 10000 familias) los gastos de
consumo familiar en la comunidad son menores a S/. 320.
10. Sean Xl , X2 y X3 variables a1eatorias independientes tales que: X1 ~ N (10 , 3 )
; X2 ~ N (12 , 4 ) y X3 ~ N (14 , 6). Si Y = X1 - 2 X2 + X3 . Se pide:
a) Hallar la media y la varianza de Y ; b) Ca1cule e interprete  8 10P Y  
Solución
X1 ~ N (10 , 3 ) 1 10  ; 32
1 
X2 ~ N (12 , 4 ) 2 12  ; 42
2 
X3 ~ N (14 , 6 ) 3 14  ; 2
3 6 
a) Cálculo de la media y la varianza de Y
    1 2 3 1 2 32 ( ) 2 ( ) ( )Y E Y E X X X E X E X E X        =
1 2 32 10 2(12) 14 0Y          Rpta.
 2
1 2 3 1 2 3( ) ( 2 ) ( ) 4 ( ) ( )Y V Y V X X X V X V X V X       
2 2 2 2
1 2 34 3 4(4) 6 25Y          Rpta.
22
b) Cálculo de la  8 10P Y  
Sabemos que 0Y  y 252
Y  5Y .
Además Y ~ N [0, 25]  Z = (Y – 0)/ 5 ~ N(0, 1). Luego:
   
8 0 0 10 0
8 10 1.6 2
5 5 5
Y
P Y P P Z
    
            
= Φ(2.0) - Φ(-1.60) = 0.97725 – 0.05480 = 0.92245 Rpta.
Interpretación: alrededor del 92.25% de los valores observados de Y se
encuentran entre -8 y 10.
11. Sean X1, X2, X3 y X4 variables aleatorias normales independientes con μ1
30; μ2 = 25 ; μ3 = 12 ; μ4 = 8 ;
2
1 = 8 ;
2
2 = 6 ;
2
3 = 6 ;
2
4 = 2. Sí:
Y = 




 
4
2 21 XX
- 3 4
2
X X 
  
Calcule e interprete: a)  8 14P Y  y b) P 12Y   
Solución:
Y = 




 
4
2 21 XX
- 3 4
2
X X 
  
= 31 2 4
4 2 2 2
XX X X
  
 μY = E(Y) =        1 2 3 4
1 1 1 1
4 2 2 2
E X E X E X E X  
=
1 1 1 1
(30) (25) (12) (8) 10
4 2 2 2
   

2
Y = V (y) = 1 2 3 4
1 1 1 1
( ) ( ) ( ) ( )
16 4 4 4
V X V X V X V X  
=
1 1 1 1
(8) (6) (6) (2) 4
16 4 4 4
   
Siendo Y una combinación lineal de las variables independientes Xi cada una
con distribución normal, entonces por la propiedad reproductiva de la
distribución normal se cumple que Y ~ N [10, 4]  Z = (Y – 10)/ 2 ~ N(0, 1).
Luego:
a)  8 14P Y  =
8 10 10 14 10
2 2 2
Y
P
   
   
= P (-1.0 ≤ Z ≤ 2.0) =
= Φ(2.0) - Φ(-1.0) = 0.97725 – 0.15866 = 0.81859 Rpta.
23
Interpretación: el 81.86% de los valores de Y se encuentran entre 8 y 14.
b) P 12Y    =  12 12P Y   =
12 10 10 12 10
2 2 2
Y
P
    
   
=
= P (-11.0 ≤ Z ≤ 2.0) = Φ(2.0) - Φ(-11.0) =
= 0.97725 – 0.00000 = 0.0.97725 Rpta.
Interpretación: alrededor del 97.73% de los valores absolutos de Y son
menores o iguales a 12.
12. En el proceso de fabricación de condensadores, varias pruebas han demostrado
que la temperatura más alta (en °C) que pueden soportar es N(125, 9). En los
sistemas en que se utilizan, la temperatura máxima (en °C) a que se sujeta un
condensador individual es N(116, 16). ¿Qué proporción de condensadores fallará
por sobre calentamiento? Interprete el resultado.
Solución
Sean: F = temperatura más alta de fabricación ~ N(125, 9) y
U = temperatura máxima de uso ~ N(116, 16)
Habrá falla por sobrecalentamiento (S) cuando S = F < U = F – U < 0.
Para hallar la proporción solicitada mediante P(S) = P(F < U) = P(F – U < 0)
determinamos la distribución de F – U usando la propiedad reproductiva de la
distribución normal, así:
F – U ~ N(9, 25)  Z = ( F – U – 9)/ 5 ~ N(0, 1).
Entonces:
P(S) = P(F < U) = P(F – U < 0) =
80 0 9
5 5
F U
P
   
 
 
=
= P(Z ≤ -1.8) = Φ(-1.8) = 0.03593 Rpta.
Interpretación: alrededor del 3.59% de los (ó 359 de cada 10000) condensadores
fabricados falla por sobrecalentamiento en los sistemas en que se utilizan.
13. En una de las etapas de un proceso de ensamble un tapón cilíndrico tiene que
ajustarse a una abertura circular seleccionando cada elemento al azar en un
suministro continuo. Los diámetros del tapón y de los casquillos en mm, son
N(24.9, 0.032
) y N(25, 0.042
) respectivamente. Si para que el ajuste sea
24
satisfactorio se requiere un claro de diámetro de cuando menos 0.02 mm, ¿en
qué proporción de los casos el ajuste no será satisfactorio? Interprete el
resultado. (claro del diámetro = diámetro del casquillo – diámetro del tapón)
Solución
Sean: T = diámetro del tapón ~ N(24.9, 0.032
) y
C = diámetro del casquillo ~ N(25, 0.042
)
Si X = claro del diámetro = C – T, usando la propiedad reproductiva de la
distribución normal se tiene que:
µX = E(X) = E(C – T) = E(C) – E(T) = 25.0 – 24.9 = 0.10
σ2
X = V(X) = V(C – T) = V(C) + V(T) = 0.0009 +0.0016 = 0.0025 = 0.052
.
Luego: X = claro del diámetro = C – T ~ N(0.10, 0.052
)
 Z = (X – 0.10)/ 0.05 ~ N(0, 1).
Que el ajuste no sea satisfactorio implica que X < 0.02. Entonces:
P(X < 0.02) =
0.10 0.02 0.10
0.05 0.05
X
P
  
 
 
= P(Z ≤ -1.8) = Φ(-1.6) = 0.0548
Rpta.
Interpretación: en alrededor del 5.48% de los (ó en 548 de cada 10000)
ensambles el tapón no se ajusta al casquillo.
14. Las pastillas metálicas cilíndricas que se utilizan en un reactor se fabrican en
serie y puede suponerse que sus longitudes siguen una distribución normal con
media 0.290 cm. y desviación estándar 0.016cm. Nueve de estas pastillas deben
ajustarse, extremo con extremo, en un recipiente que ocupa una longitud no
mayor de 2.670 cm. Si las nueve pastillas se ensamblan al azar, ¿qué proporción
de estos no se ajustará en el espacio requerido? Interprete el resultado.
Solución
Sean: Xi = diámetro de las pastillas ~ N(0.29, 0.0162
) y
L = longitud del recipiente con 9 pastillas =
9
1
i
i
X

 .
Por la propiedad reproductiva de la distribución normal, se tiene que:
E(L) = E(
9
1
i
i
X

 ) =
9
1
( )i
i
E X

 =
9
1
0.29
i
 = 9 x 0.29 = 2.61 cm.
25
V(L) = V(
9
1
i
i
X

 ) =
9
1
( )i
i
V X

 =
9
2
1
0.016
i
 = 9 x 0.0162
= 0.002304 cm2
.
Luego:
L = longitud del recipiente con 9 pastillas =
9
1
i
i
X

 ~ N(2.61, 0.0002304)
 Z = (L – 2.61)/ 0.048 ~ N(0, 1).
Las 9 pastillas no se ajustan al espacio requerido si L > 2.67. Por lo tanto:
P(L > 2.67) = 1 – P(L ≤ 2.67) = 1 -
2.61 2.67 2.61
0.048 0.048
L
P
  
 
 
=
= 1 - P(Z ≤ 1.25) = 1 - Φ(1.25) = 1 - 0.89435 = 0.10565 Rpta.
Interpretación: en alrededor del 10.56% de los (ó en 1056 de cada 10000)
recipientes con 9 pastillas, éstas no se ajustan en el espacio requerido.
15. Suponga que las variables aleatorias X1 , X2 , .... , X50 representan la vida útil de
50 tubos electrónicos; los mismos que se usan de la siguiente manera: tan pronto
como falla el primer tubo, empieza a funcionar el segundo y cuando falla el
segundo empieza a funcionar el tercero, etc. Suponga que los Xi, i = 1, 2, …., 50
tienen distribución exponencial con parámetro λ = 1/500. ¿Cuál es la
probabilidad que el tiempo de funcionamiento de los 50 tubos esté comprendido
entre 20 000 y 30 000 horas? Interprete el resultado.
Solución
Sea Xi = tiempo de funcionamiento del tubo i ~ Exponencial (λ = 1/500)
Entonces µ = E(Xi) = 1/ λ = 500 , σ2
= 1/ λ2
= 5002
] i = 1, 2, …., 50.
Sea Y50 = tiempo de funcionamiento de los 50 tubos =
=
50
1 2 50
1
............ i
i
X X X X

    
Entonces, por el teorema del límite central la probabilidad solicitada es:
P(20 000 ≤ Y50 ≤ 30 000) =
=
50
1
50 500
20000 50 500 30000 50 500
500 50) 500 50) 500 50)
i
i
X x
x x
P
x x x

 
  
  
 
 
 

= P(-1.41 ≤ Z ≤
1.41)
26
= Φ(1.41) - Φ(-1.41) = 0.92073 – 0.07927 = 0.84146 Rpta.
Interpretación: en alrededor del 84.15% de los (ó en 8415 de cada 10000)
tiempos de funcionamiento de 50 tubos estará comprendido entre 20 000 y 30
000 horas.
16. Las botellas de aceite vegetal “Primor” tienen un contenido medio de 1 litro y
una desviación estándar de 0.04. Para la distribución se acomodan en cajas de 36
botellas, Calcule e interprete la probabilidad que una caja contenga más de 36.6
litros.
Solución
Sea Xi = contenido de las botellas de aceite ~ [µ = 1, σ = 0.04 lts.]
Sea Y36 = contenido por caja de las 36 botellas =
=
36
1 2 36
1
............ i
i
X X X X

    
Entonces, por el teorema del límite central la probabilidad solicitada es:
P(Y36 > 36.6) = 1 - P(Y36 ≤ 36.6) = 1 -
36
1
36 1
36.6 36 1
0.04 36 0.04 36
i
i
X x
x
P 
 
 
 
 
 
 

=
= 1 – P(Z ≤ 2.5) = 1- Φ(2.5) = 1 – 0.99379 = 0.00621 Rpta.
Interpretación: alrededor del 0.62% de las (ó en 62 de cada 10000) cajas con 36
botellas de aceite el contenido es de más de 36.6 litros.
17. En una ciudad grande el 20% de los hogares no tiene desagüe. Si se eligen 100
hogares al azar, calcule e interprete la probabilidad de que más de 30 hogares no
tengan desagüe.
Solución
Sea Xi = 1, si el hogar no tiene desagüe ~ Bernoulli [p = 0.20]
Sea Y100 = el total de hogares sin desagüe, entre los 100 elegidos =
=
100
1 2 100
1
............ i
i
X X X X

     ~ B[n = 100, p = 0.20] ó N[np = 20, npq =
16]
Entonces, por el teorema del límite central la probabilidad solicitada es:
27
P(Y100 > 30) = 1 - P(Y100 ≤ 30) = 1 -
100
1
100 0.20
30 100 0.20
0.20 0.80 100 0.20 0.80 100
i
i
X x
x
P
x x

 
 
 
 
 
 

=
= 1 – P(Z ≤ 2.5) = 1- Φ(2.5) = 1 – 0.99379 = 0.00621 Rpta.
Interpretación: en alrededor del 0.62% de los (ó en 62 de cada 10000) grupos de
100 hogares escogidos, más de 30 hogares no tienen desagüe.
18. Un lote de 10 000 pavos tiene un peso medio de 7 Kg. y una desviación
estándar de 0.15 Kg. Este lote debe ser entregado a los vendedores minoristas a
razón de 100 cada uno. ¿Cuál es la probabilidad de que un vendedor cualquiera
de estos tomados al azar, reciba un peso total de menos de 697 kilos? Interprete
su resultado.
Solución
Sea Xi = peso de los pavos ~ [µ = 7, σ = 0.15 Kg.]
Sea Y100 = peso total de los 100 pavos =
100
1 2 100
1
............ i
i
X X X X

    
Entonces, por el teorema del límite central la probabilidad solicitada es:
P(Y100 < 697) =
100
1
100 7
697 100 7
0.15 100 0.15 100
i
i
X x
x
P 
 
 
 
 
 
 

=
= P(Z < -2.0) = Φ(-2.0) = 0.02275 Rpta.
Interpretación: alrededor del 2.28% de los (ó 228 de cada 10000) vendedores
minoristas recibe un peso total menor a 697 Kg.
19. La Constructora “Techito” estima que el peso promedio de las personas que
vivirán en un edificio de apartamentos es de 68 Kg., con una desviación estándar
de 15 Kg. De acuerdo con la estimación, instala en el edificio un ascensor para
36 personas con capacidad máxima de 2700 Kg. Si la estimación es correcta,
calcule e interprete la probabilidad de que un cupo completo exceda la capacidad
del ascensor.
Solución
28
Sea Xi = peso de las personas ~ [µ = 68, σ = 15 Kg.]
Sea Y36 = peso total de las 36 personas =
36
1 2 36
1
............ i
i
X X X X

    
Entonces, por el teorema del límite central la probabilidad solicitada es:
P(Y36 > 2700) = 1 - P(Y36 ≤ 2700) = 1 -
36
1
36 68
2700 36 68
15 36 15 36
i
i
X x
x
P 
 
 
 
 
 
 

=
= 1 – P(Z ≤ 2.8) = 1- Φ(2.8) = 1 – 0.99744 = 0.00256 Rpta.
Interpretación: alrededor del 0.26% de los (ó en 256 de cada 10000) cupos
completos del ascensor con 36 personas exceden su capacidad máxima de 2700
Kg.
20. Las botellas de ron “Pepito” tienen un contenido medio de 2 litros y una
desviación estándar de 0.018. Para la distribución se acomodan en cajas de 36
botellas, Calcule e interprete la probabilidad que una caja contenga más de 72.36
litros.
Solución
Sea Xi = contenido de las botellas de ron ~ [µ = 2, σ = 0.018 lts.]
Sea Y36 = contenido por caja de las 36 botellas =
36
1 2 36
1
............ i
i
X X X X

    
Entonces, por el teorema del límite central la probabilidad solicitada es:
P(Y36 > 72.36) = 1 - P(Y36 ≤ 72.36) = 1 -
36
1
36 2
72.36 36 2
0.018 36 0.018 36
i
i
X x
x
P 
 
 
 
 
 
 

=
= 1 – P(Z ≤ 3.33) = 1- Φ(3.33) = 1 – 0.99957 = 0.00043 Rpta.
Interpretación: alrededor del 0.04% de las (ó en 4 de cada 10000) cajas con 36
botellas de ron contienen más de 72.36 litros.
29
EJERCICIOS PROPUESTOS
1. Sea Z una variable aleatoria con distribución normal estándar [Z ~ N(0, 1)].
Hallar las probabilidades siguientes:
a) P(Z ≤ 2.15)
b) P(0.80 < Z < 1.96)
c) P(-2.45 < Z ≤ 1.65)
d) P(-2.75 ≤ Z ≤ -0.65)
e) P(Z ≥ -1.38)
f) P(-2.57 ≤ Z < 0)
g) P(0 ≤ Z < 2.33).
2. Sea Z una variable aleatoria normal estándar [Z ~ N(0, 1)]. Hallar el valor de z
para los casos siguientes:
a) Φ(z) = 0.8665
b) Φ(z) = 0.9222
c) Φ(z) = 0.9972
d) el área entre –z y z es 0.99
e) el área a la izquierda de z es 0.05
f) el área a la derecha de z es 0.025
3. El contenido en las botellas de cierta gaseosa tiene distribución normal con
media µ= 1000 ml. y desviación estándar σ = 5 ml. Calcule e interprete la
probabilidad de que una botella de gaseosa tenga:
a) Entre 990 y 1005 ml.
b) Menos de 985 ml.
4. El precio que pagan los hogares por el kilo de pescado en una gran ciudad tiene
distribución normal con media µ= S/. 12 y desviación estándar σ = S/. 0.80.
Calcule e interprete la probabilidad de que el precio pagado por el kilo de
pescado:
a) Sea menor de S/. 10.
b) Se encuentre entre S/. 10.50 y 13.50.
c) Por arriba de que precio paga el 10% superior de los consumidores.
30
5. El tiempo que dura la atención a los clientes de un negocio se distribuye
normalmente con media µ= 30 minutos y desviación estándar σ = 4 minutos.
Calcule e interprete la probabilidad de que el tiempo de atención a los clientes:
a) dure entre 25 y 40 minutos.
b) Entre que límites simétricos alrededor de µ dura el 95% de las atenciones.
6. El peso de las cajas de mango se distribuye normalmente con media µ= 20 Kg. y
desviación estándar σ = 0.5 Kg. Si se almacenan 2000 cajas, calcule e interprete
¿qué cantidad de cajas pesan:
a) menos de 19 kilos?
b) entre 19.5 y 21 kilos?
7. El peso de los huevos de gallina producidos por una avícola se distribuye
normalmente con media µ= 65 gr. y desviación estándar σ = 5 gr. Si se
almacenan 2000 huevos, calcule e interprete ¿qué cantidad de huevos pesan:
a) Menos de 70 gramos?
b) Entre 55 y 60 gramos?
8. La duración de ciertos focos eléctricos tiene distribución normal con media µ=
1000 horas y desviación estándar σ = 200 horas. Si compra 2000 de estos focos,
calcule e interprete:
a) ¿Cuántos focos durarán menos de 600 horas?
b) ¿Cuántos focos durarán entre 850 y 1300 horas?
9. El volumen de ventas diarias de bolsas de azúcar de la comercializadora
“Yapatera” tiene distribución normal con media µ= 800 bolsas y desviación
estándar σ = 100. En un período de 60 días, calcule e interprete:
a) ¿En cuántos días el volumen de ventas es de 600 o menos bolsas de azúcar?
b) ¿En cuántos días el volumen de ventas es mayor de 900 bolsas de azúcar?
10. Sean X1 y X2 variables aleatorias independientes distribuidas normalmente con
μ1 50; μ2 = 35;
2
1 = 10;
2
2 = 6. Si: Y = X1 - X2. Calcule e interprete:
a) La media y la varianza de Y
b)  10 25P Y 
31
11. Sean X1, X2 y X3 variables aleatorias independientes distribuidas normalmente
con μ1 10; μ2 = 15; μ3 = 12;
2
1 = 3;
2
2 = 4;
2
3 = 6. Sí: Y = X1 + 2 X2 -
X3
Calcule e interprete:
a)  20 40P Y 
b) P 18Y 
12. Los teléfonos celulares A y B tienen una duración (en días) que son N(2190,
2002
) y N(2878, 2502
) respectivamente. Si se prueba la vida de cada uno de los
teléfonos correspondientes a cada una de las marcas, ¿cuál es la probabilidad que
los A duren un año o más que los B? Interprete su resultado.
13. En una ciudad grande el 20% de hogares no tiene agua. Si se escogen 100
hogares, calcule e interprete la probabilidad que más de 30 no tengan agua.
14. Al lanzar una moneda 100 veces, calcule e interprete la probabilidad de obtener
entre 40 y 60 caras.
15. Las cajas con limón tienen un peso medio de 20 Kg. y una desviación estándar
de 750 gr. Calcule e interprete la probabilidad de que el peso de 410 cajas
recibidas al azar y cargadas en un camión, supere su capacidad máxima que es
de 8,250 kg.
16. Los pesos de los sacos de algodón Pima cosechados tienen una media de 50
kilos y una desviación estándar de 1.4 kilos. Calcule e interprete la probabilidad
de que el peso de 100 paquetes seleccionados al azar sea menor de 4975 kilos.
17. Las cajas con naranja tienen un peso medio de 15 Kg. y una desviación estándar
de 0.5 kilos. Calcule e interprete la probabilidad de que el peso de 400 cajas
tomadas al azar sea menor de 5,980 kg.
18. Un lote de 10 000 pollos para parrilla tiene un peso medio de 1 Kg. y una
desviación estándar de 0.05 Kg. Este lote debe ser entregado a las pollerías a
razón de 100 cada una. ¿Cuál es la probabilidad de que una pollería, cualquiera
32
de estas tomada al azar, reciba un peso total de menos de 98.5 kilos? Interprete
su resultado.
19. Los pesos de los paquetes recibidos en las tiendas Ripley tienen una media de
580 libras y una desviación estándar de 80 libras. Calcule e interprete la
probabilidad de que el peso de 49 paquetes recibidos al azar y cargados en un
montacargas, supere su capacidad de 30 000 libras.
20. Un lote muy grande de cajas con palta tiene un peso medio μ = 20 Kg. y una
desviación estándar σ = 0.5 Kg. Este lote debe ser entregado a los
supermercados a razón de 100 cajas cada uno. Calcule e interprete ¿la
probabilidad de que un supermercado cualquiera, reciba un peso total de
menos de 1 990.2 Kg.?
33
Capítulo 2. DISTRIBUCIONES MUESTRALES
“¿Hace falta remarcar que un país que no conoce su demografía,
tampoco conoce su economía? No se puede saber lo que un país
produce y ahorra si se ignora esta cosa fundamental: la población. ....
En un país donde no se puede contar a los hombres, menos aún se
puede contar la producción. Se desconoce el primero de sus factores:
el factor humano, el factor trabajo..”
José Carlos Mariátegui
CONTENIDO
2.1 Distribuciones muestral de la media.
2.2 Distribución muestral del total (conocida la media)
2.3 Distribución de la diferencia de medias muestrales.
2.4 Distribución muestral de la proporción.
2.5 Distribución muestral del total (conocida la proporción)
2.6 Distribución muestral de la diferencia de proporciones.
2.7 Ejercicios resueltos.
2.8 Ejercicios propuestos.
La estadística es una ciencia importante porque permite el conocimiento de la
población basándose en muestras aleatorias representativas. El principal problema de
la estadística es estudiar una población con función de cuantía o función de densidad,
f(x, θ) conocida o supuestamente conocida, con parámetro θ desconocido. Si se
conoce θ, la distribución de probabilidad queda determinada. Para ello, se toma una
muestra aleatoria de tamaño n (X1 , X2 , .... , Xn ) de una población de tamaño N y se
busca alguna función de esta muestra que estime el parámetro desconocido θ,
problema que será abordado con mayor detalle en el capítulo de estimación.
En este capítulo se desarrollan las distribuciones muestrales para muestras grandes (n
≥ 30 ) referidas a la media, a la diferencia de medias, a la proporción, a la diferencia
de proporciones y a los totales (conocida la distribución de la media y la proporción).
Cabe resaltar que el conocimiento de estas distribuciones muestrales es el soporte
fundamental para poder comprender el desarrollo de la estimación por intervalos y la
docimasia de hipótesis a tratar capítulos más adelante. A continuación se desarrolla
cada uno de los conceptos importantes de las distribuciones muestrales.
34
Población.- es el conjunto de todas las unidades de análisis (individuos u objetos) a
ser observadas y que poseen una característica común. Es decir, es el conjunto de
todas las observaciones posibles que puede tomar una variable aleatoria X. Por
ejemplo, en todas las empresas podemos estudiar: el número de trabajadores, las
ventas, etc.; en todos los hogares podemos estudiar: los ingresos, los gastos, etc.
Muestra.- es una parte representativa de la población. La representatividad implica
adecuado: método de muestreo, tamaño de muestra, selección de la muestra y
propuesta de estimadores (fórmulas). Relacionado al ejemplo anterior, la muestra
vendría dada por una parte representativa de empresas u hogares.
Muestra Aleatoria.- Sea X una variable aleatoria con distribución de probabilidad
f(x) (función de cuantía o función de densidad) con media μ y varianza σ2
. Una
muestra aleatoria (m.a.) de tamaño n de X, es un conjunto de n variables aleatorias
(X1 , X2 , .... , Xn ) que cumplen:
1. Cada Xi (i = 1, 2, .... , n) tiene la misma distribución que X. Es decir, tienen la
misma distribución de probabilidades )()( xfxf XXi
 , la misma función de
distribución acumulativa )()( xFxF XXi
 , la misma media iX = E(Xi) = E(X)
= μ con
N
X
N
i
i
 1
 y la misma varianza 2
IX = V(Xi ) = V(X) =
N
X
N
i
i

 1
2
2
)( 
 .
2. Las variables aleatorias Xi (i = 1, 2, .... , n) son independientes. Por lo tanto la
función de probabilidad conjunta de la muestra aleatoria X1 , X2 , .... , Xn está
dada por:


n
i
iXnXXXnXXX XfXfXfXfXXXf n
1
2121,....,, )()()....()(),....,,(21
.
Esta probabilidad de ocurrencia de la muestra observada, es importante en
estimación puntual, ya que allí representa la función de verosimilitud a
maximizar.
Nota:
35
 La definición de m.a. se cumple cuando la muestra proviene de una población
infinita (discreta o continua) y cuando la muestra se extrae con reemplazo de
una población finita.
 La definición de m.a. no se cumple cuando el muestreo es sin reemplazo de una
población finita, ya que las v.a. X1 , X2 , .... , Xn no son independientes. Sin
embargo, si el tamaño n de la muestra es muy pequeño en comparación con el
tamaño N de la población (n < 5% N ) se cumple aproximadamente la
definición.
Ejemplo 1.-
Si se toma una m.a. de tamaño n, de una población X con distribución de Poisson,
con parámetro λ, hallar la función de probabilidad conjunta (función de
verosimilitud) para dicha muestra.
Solución:
Como la v.a. X ~ Poisson (λ), entonces Xi ~ Poisson (λ) y su función de
probabilidad es: ni
X
e
Xf
i
X
iX
i
,....,2,1,
!
)( 


; Xi = 0, 1, 2, 3, ......
Luego la función de probabilidad conjunta (función de verosimilitud) será:
)()....()(),....,,( 2121,....,, 21 nXXXnXXX XfXfXfXXXf n
 = 
n
i i
X
X
ei
1 !


= 




 
!1
1
X
eX 






 
!2
2
X
eX 

 .... 




 
!n
X
X
en 

=
=



n
i
i
n
X
X
e
n
i
i
1
!
1 

, Xi = 0, 1, 2, 3, ...... ;  i = 1, 2, .... , n .
Rpta.
Ejemplo 2.-
Si se toma una m.a. de tamaño n, de una población X con distribución N(μ , σ2
),
hallar la función de probabilidad conjunta (función de verosimilitud) para dicha
muestra.
Solución:
36
Como la v.a. X ~ N(μ , σ2
), entonces Xi ~ N(μ , σ2
) y su función de probabilidad
está dada por:  
,;
2
1
)(
22
2/)(
2 i
X
iX XeXf i 

i = 1, 2, 3, .... , n.
Luego la función de densidad conjunta (función de verosimilitud) será:
)()....()(),....,,( 2121,....,, 21 nXXXnXXX XfXfXfXXXf n
 =
= 




  22
1 2/)(
2
2
1 

X
e 




  22
2 2/)(
2
2
1 

X
e  .... 




  22
2/)(
2
2
1 

nX
e
=
= 




 

,;
2
1 1
22
2/)(2
2 i
X
n
xe
n
i
i 

i = 1, 2, 3, .... , n. Rpta.
Estadístico.- es una variable aleatoria que depende sólo de la muestra observada.
Así, si X1 , X2 , .... , Xn es una m.a. de una población X, entonces la media muestral
( X ) y la varianza muestral (s2
) son estadísticos. Donde:
n
X
X
n
i
i
 1
y
1
)(
1
2
2




n
XX
s
n
i
i
Distribución muestral.- es la distribución de probabilidad de un estadístico.
Error estándar de un estadístico.- es la desviación estándar de la distribución
muestral de un estadístico.
Error relativo de un estadístico.- es el coeficiente de variación de la distribución
muestral de un estadístico.
Teorema 1.- Sea X1 , X2 , .... , Xn una muestra aleatoria de tamaño n de una
población X, con media E(X) = μ y varianza Var (X) = σ2
. Sea
n
X
X
n
i
i
 1
la
media muestral, entonces: )(XE y
n
XVarX
2
2
)(

  .
Teorema 2.- Sea X1 , X2 , .... , Xn una muestra aleatoria sin reemplazo de tamaño n
de una población X de tamaño N, con media E(X) = E(Xi ) = μ y varianza Var (X)
= Var (Xi) = σ2
.
Entonces: )(XE y 




 









N
nN
n
S
N
nN
n
XVarX
22
2
1
)(

 .
37
Donde:
1
)(
1
2
2




N
X
S
N
i
i 
, representa la cuasivarianza poblacional y el factor
1

N
nN
se llama factor de corrección para poblaciones finitas (f.c.p.f.) el mismo que
es descartado cuando la fracción de muestreo (f )
1
1
97.005.0 



N
nN
N
n
f .
A continuación presentamos las distribuciones muestrales de la media, del total
(conocida la media), de la diferencia de medias muestrales, de la proporción, del total
(conocida la proporción) y de la diferencia de proporciones. Todas ellas de suma
importancia en el diario quehacer de muchos campos de la investigación científica,
ya que como estudiaremos más adelante, van a permitir la determinación de
intervalos de confianza y la verificación de hipótesis para los parámetros
poblacionales.
2.1 DISTRIBUCIÓN MUESTRAL DE LA MEDIA
Teorema 3.- Si X1 , X2 , .... , Xn es una muestra aleatoria de tamaño n de una
población X, con media E(X) = μ y varianza Var (X) = σ2
. Entonces, por el
teorema central del límite, la media muestral
n
X
X
n
i
i
 1
tiene aproximadamente
distribución normal con media μ y varianza σ2
/n. )/,( 2
nNX  . Y la variable
aleatoria
n
X
Z
/
)(


 tiene aproximadamente distribución N(0, 1).
Este teorema es válido para cualquier población finita o infinita, discreta o continua,
cuando el tamaño de la muestra n ≥ 30. Si la población es normal, se cumple
cualquiera sea el tamaño n de la muestra.
Cuando la población es finita de N elementos y el muestreo es sin reemplazo, la
variables aleatorias Xi no son independientes, entonces la distribución de X es
hipergeométrica, con:
)(XE y 








1
)(
2
2
N
nN
n
XVarX

 . Luego:
38
Teorema 4.- Si X1 , X2 , .... , Xn es una muestra aleatoria de tamaño n extraida sin
reemplazo de una población X finita de tamaño N, con media E(X) = μ y varianza
Var (X) = σ2
. Entonces, la media muestral
n
X
X
n
i
i
 1
tiene aproximadamente
distribución normal con media μ y varianza 








1
)(
2
2
N
nN
n
XVarX

 . Y la
variable aleatoria
1
)(




N
nN
n
X
Z


tiene aproximadamente distribución N(0, 1).
Ejemplo 3.-
En Lima Metropolitana la botella de aceite “primor” de un litro tiene un precio
promedio de S/. 5.00 y una desviación estándar de S/. 0.40. Si se toman muestras
aleatorias de 50 precios, se pide calcular e interpretar: a) la probabilidad que el precio
promedio muestral se encuentre entre S/. 4.85 y 5.10; b) la probabilidad que el
precio medio muestral sea inferior a S/. 4.80; y c) dentro de que límites simétricos
alrededor del precio promedio verdadero se encontrará el 95 % de los precios
promedios muestrales.
Solución.-
Como datos del problema se tiene que: μ = S/. 5.00 , σ = S/. 0.40 y n = 50.
n
XVarX
2
2
)(

  = (0.40)2
/ 50 = 0.0032 .057.0 X S/.
Luego: )0032.0;00.5(NX  y )1,0(
057.0
)00.5(
N
X
Z 

 . Nos piden:
a) P(4.85  X  5.10) = 




 




057.0
00.510.5
057.0
00.5
057.
00.585.4 X
P =
= P(-2.63  Z  1.75) =  (1.75) -  (-2.63) =
= 0.95994 – 0.00427 = 0.95567 Rpta.
Interpretación.- el 95.567% de los precios promedios muestrales de las botellas de
aceite “primor” de un litro, se encuentran entre S/. 4.85 y 5.10, para muestras de
50 precios.
b) P( X < 4.80) = 00022.0)51.3()
057.0
00.580.4
057.0
00.5
( 



ZP
X
P
39
Interpretación.- el 0.022% de los precios promedios muestrales de las botellas de
aceite “primor” de un litro, será inferior a S/. 4.80, para muestras de 50 precios.
c) Sean 5.00 – E y 5.00 + E los límites simétricos alrededor de la media μ = S/.
5.00, dentro de los cuales estará el 95 % de las X . Entonces:
0.95 = P(5.00 – E  X  5.00 + E) = 

)
057.0057.0
(
E
Z
E
P
= 
















 






975.0
057.0
1
057.0
2
057.0057.0
EEEE

11.0)057.0(96.196.1
057.0
975.0  EZ
E
. Luego los límites serán:
5.00 – E= 5.00 – 0.11 = S/. 4.89 y 5.00 + 0.11 = S/. 5.11. Es decir:
0.95 = P(4.89  X  5.11)
Interpretación.- el 95 % de los precios promedios muestrales de las botellas de
aceite “primor” de un litro, se encuentran entre S/. 4.89 y 5.11 alrededor de μ =
S/. 5.00, para muestras de 50 precios.
2.2 DISTRIBUCIÓN MUESTRAL DEL TOTAL (conocida la media)
En muchas situaciones vamos a estar interesados en efectuar estimaciones de un
total poblacional, conocida la media muestral, para lo cual se tiene que tener presente
lo siguiente:
Sí el promedio poblacional es:
N
X
N
i
i
 1

El total de la población se define como: NXX
n
i
i  1
el cual es estimado por: XNNX  ˆˆ
Utilizando la propiedad reproductiva de la distribución normal, el teorema
central del límite y los operadores esperanza y varianza para el estimador de
total, llegamos al resultado siguiente:
 22
,ˆˆ XNNNXNNX   y
XN
NXN
Z


 ~ N(0, 1)
Donde la varianza del estimador del total está dada por:
40

n
NNXVarNXNVarNVarXVar X
2
2222
)()()ˆ()ˆ(

  , si la
fracción de muestreo f = n / N  0.05 , o

1
)()()ˆ()ˆ(
2
2222



N
nN
n
NNXVarNXNVarNVarXVar X

 , si
la fracción de muestreo f = n / N > 0.05.
2.3 DISTRIBUCIÓN DE LA DIFERENCIA DE MEDIAS MUESTRALES
Esta distribución va a surgir cuando estemos interesados en efectuar la comparación
de las medias de dos poblaciones. Por ejemplo: comparar el precio promedio
poblacional de un bien o servicio en la ciudad X (μX ) y el precio promedio
poblacional del mismo bien o servicio en la ciudad Y (μY ). O comparar los ingresos
promedios, ventas promedios, los rendimientos promedios, etc. no sólo entre
ciudades, sino también entre grupos.
Esta comparación se formula así: ¿Serán iguales los precios promedios de un bien o
servicio en las ciudades X e Y (o en las ciudades 1 y 2)? Que es idéntico a
plantearse ¿μX = μY o μX – μY = 0? o también ¿μ1 = μ2 o μ1 – μ2 = 0?
Es decir, que esta comparación se reduce a conocer la diferencia de medias
poblacionales, la misma que va a requerir tomar muestras aleatorias de ambas
poblaciones y estudiar el comportamiento de la media muestral en cada una de ellas,
de la siguiente manera:
 Sea X1 , X2 , .... , Xn es una muestra aleatoria de tamaño n, de una población X de
tamaño N, con media E(X) = μX y varianza Var (X) = 2
X . Sabemos que la
media muestral
n
X
X
n
i
i
 1
tiene aproximadamente distribución normal:
),( 2
XXNX  . Donde:
n
X
X
2
2 
  o 








1
)(
2
2
N
nN
n
XVar X
X

 ..... (1)
 Sea Y1 , Y2 , .... , Ym una muestra aleatoria de tamaño m, de una población Y de
tamaño M, con media E(Y) = μY y varianza Var (Y) = 2
Y . Sabemos que la
media muestral
m
Y
Y
m
i
i
 1
tiene aproximadamente distribución normal:
41
),( 2
YYNY  . Donde: m
Y
Y
2
2 
 
o









1
)(
2
2
M
mM
m
YVar Y
Y


..... (2)
 De (1) y (2) tenemos que X - Y es una variable aleatoria con media:
      YXYXYX YEXEYXE  
y varianza:
      222
YXYX YVarXVarYXVar  
2
YX  =
n
X
2

+
m
Y
2

o 







1
2
N
nN
n
X
+ 







1
2
M
mM
m
Y
.............. (3)
Además, por la propiedad reproductiva de la distribución normal, de (1) y (2) se tiene
que:
X - Y ~ N( YX   , 2
YX  ) y
YX
YXYX
Z




 )( )
~ N(0 , 1)
donde YX  se obtiene a partir de (3).
Sintetizamos lo expuesto hasta aquí en el teorema 5.
Teorema 5.- Si X y Y son las medias de dos muestras aleatorias (de tamaños n y
m) de dos poblaciones X e Y, con medias μX y μY , y varianzas Var (X) = 2
X y
Var (Y) = 2
Y , respectivamente, entonces la distribución muestral de la diferencia de
medias es aproximadamente normal N( YX   , 2
YX  ) y la variable aleatoria
mn
YX
Z
YX
YX
22
) )(




 o


















11
)(
22
)
M
mM
mN
nN
n
YX
Z
YX
YX


tiene
aproximadamente distribución normal estándar N(0 , 1).
Si n y m son mayores o iguales que 30, la aproximación a la normal para la
diferencia de medias muestrales es óptima.
Si las poblaciones X e Y son normales, el teorema se cumple para cualesquier
tamaño de muestra.
Ejemplo 4.-
Ciertas bolsas de café tienen un peso medio de 500 gr. y una desviación estándar de
20 gr. Cierto día de producción se toman independientemente dos muestras al azar
sin reposición, con n = 500 y m = 800. ¿Cuál es la probabilidad que los pesos medios
42
de las dos muestras difieran a) en más de 2 gr.? y b) en menos de 1gr.? Interpretar
los resultados.
Solución.-
Sea X la muestra de tamaño n = 500 bolsas de café, con μX = 500 gr. y X = 20 gr.
Sea Y la muestra de tamaño m = 800 bolsas de café, con μY = 500 gr. y Y = 20 gr.
Luego: YX  = YX   = 500 – 500 = 0, 2
YX  =
n
X
2

+
m
Y
2

=
800
20
500
20 22
 =
1.3 y YX  = 1.14 gr.
Además, X - Y ~ N(0, 1.3) y
14.1
0

YX
Z ~ N(0 , 1). Nos piden:
a) P ( X - Y > 2 ) = 1 - P ( X - Y  2 ) = 1 - P(-2  X - Y  2) =
= 1 - 




 




14.1
02
14.1
0
14.1
02 YX
P = 1 - P(-1.75  Z 
1.75) =
= 1 – [ (1.75) -  (-1.75)] = 1 - [ (1.75) – 1 +  (1.75)] =
= 2 – 2  (1.75) = 2 – 2 (0.95994) = 0.08012 Rpta.
Interpretación.- en el 8.01% de las comparaciones, para muestras de 500 y 800
bolsas de café respectivamente, las diferencias de pesos medios serán mayores a 2
gramos.
b) P ( X - Y < 1 ) = P( -1 < X - Y < 1) =
= 




 




14.1
01
14.1
0
14.1
01 YX
P = P(-0.88  Z  0.88) =
= (0.88) - (-0.88) = 0.81057 – 0.18943 = 0.62114 Rpta.
Interpretación.- en el 62.11% de las comparaciones, para muestras de 500 y 800
bolsas de café respectivamente, las diferencias de pesos medios serán menores de
1 gramo.
43
2.4 DISTRIBUCIÓN MUESTRAL DE LA PROPORCIÓN
En muchos estudios vamos a estar interesados en clasificar los datos cualitativos o
cuantitativos de la población en dos clases distintas (población dicotómica o
binomial) tales como: éxitos y fracasos; hombres y mujeres; a favor y en contra;
aprueba y desaprueba; jóvenes (menores de x años) y adultos (de x años y más);
caras y sellos; empleados y desempleados; etc.
En este caso, se desea estimar la proporción de unidades (P) o el número total de
unidades (A) en la población que poseen una cierta característica o atributo que
cae dentro de una clase definida. Por ejemplo, se desea estimar:
- El porcentaje (o número) de personas que consumen un cierto producto.
- El porcentaje (o número) de clientes que compran más de 10 000 dólares
mensuales.
- El porcentaje (o número) de ciudadanos que está a favor de un personaje.
Notación: Además de la notación usada anteriormente, si se define la v.a.
Bernoulli:
Xi = 1, si la unidad estadística observada posee la característica de interés
(éxito).
Xi = 0, si la unidad estadística no posee la característica de interés (fracaso).
Entonces:
N
X
PyXA
N
i
iN
i
i

 

 1
1
representan el número total de unidades (A) y la
proporción (P) de unidades en la población que poseen una cierta característica.
Suponga que se extrae una muestra aleatoria simple de tamaño n de la población
binomial, entonces la proporción muestral p definida como:
.,1
Paestima
n
X
n
X
p
n
i
i


44
X = 
n
i
iX
1
= número de éxitos en la muestra es una v.a. Binomial (n, P). La
proporción muestral p, es una media muestral de v.a. Bernoulli con E(Xi ) = P y
V(Xi ) = P Q; representa la proporción de éxitos en la muestra y estima a la
proporción de éxitos en la población P. Es decir, que p tiene el mismo
comportamiento de una media muestral X . Por lo tanto:
 PnP
n
P
n
XE
nn
X
EpE
n
i
n
i
i
n
i
i













 



)(
11
)(
1
)(
11
1
 2
11
)(
)(
n
XVar
n
X
VarpVar
n
i
i
n
i
i  













 (propiedad de la varianza)
2
22
1
2
1
)(
p
n
i
n
i
i
n
PQ
n
nPQ
n
PQ
n
XVar

 
Luego: 







n
PQ
PN
n
X
n
X
p
n
i
i
,1
y
n
PQ
Pp
Z

 ~ N(0, 1)
Si el muestreo se efectúa sin reemplazo de una población binomial finita, la
distribución muestral de p sigue la distribución hipergeométrica y su varianza
requiere el factor de corrección para poblaciones finitas (salvo que la fracción de
muestreo f = n/N sea menor del 5%, donde no se utiliza). Entonces:
















1
,1
N
nN
n
PQ
PN
n
X
n
X
p
n
i
i
45
y










1N
nN
n
PQ
Pp
Z ~ N(0, 1)
Ejemplo 5.-
Según el Censo Nacional de Talla en Escolares de 19991
la desnutrición crónica en el
Perú era del 27.9%. Si se toma una muestra al azar sin reposición, de n = 1500 niños
y niñas. Calcule e interprete la probabilidad que: a) la desnutrición crónica muestral
se encuentre entre 26 y 30%? y b) dentro de que límites simétricos alrededor de la
proporción verdadera de desnutridos crónicos se encontrará el 95% de las
proporciones muestrales.
Solución.-
El mencionado Censo tiene los siguientes datos:
N = 2 059 426 niños y niñas censados como casos válidos = tamaño de la población.
X = 
N
i
iX
1
= 574 314 niños y niñas desnutridos crónicos.
426,059'2
314,5741


N
X
N
X
P
N
i
i
= 0.279 = proporción censal de niños y niñas con
desnutrición crónica.
Q = 0.721 = proporción censal de niños y niñas sin desnutrición crónica.
n = 1500 niños y niñas = tamaño de la muestra.
Como la fracción de muestreo n/N es menor de 0.05, entonces, la proporción
muestral:
1
Ministerio de Educación. Nutrición y Retardo en el Crecimiento. Resultados del II Censo Nacional de Talla en Escolares 1999.
Lima, Perú, Noviembre de 2000.
46
 0001341.0;279.0,1
N
n
PQ
PN
n
X
n
X
p
n
i
i








y
0116.0
279.0
0001341.0
279.0 





pp
n
PQ
Pp
Z ~ N(0, 1)
Se pide calcular:
a) P ( 0.26  p  0.30 ) = 




 




0116.0
279.030.0
0116.0
279.0
0116.0
279.026.0 p
P
= P( -1.64  Z  1.81 ) =  (1.81) -  (-1.64) =
= 0.96485 – 0.05050 = 0.91435 Rpta.
Interpretación.- en el 91.44 % de las muestras de 1500 niños y niñas a nivel
nacional, el porcentaje de desnutridos crónicos, se encuentra entre el 26 y 30 %.
b) Sean 0.279 – E y 0.279 + E los límites simétricos alrededor de la proporción
verdadera P = 0.279 , dentro de los cuales estará el 95 % de las p. Entonces:
0.95 = P(0.279 – E  p  0.279 + E) = 

)
0116.00116.0
(
E
Z
E
P
= 
















 






975.0
0116.0
1
0116.0
2
0116.00116.0
EEEE

023.0)0116.0(96.196.1
0116.0
975.0  EZ
E
. Luego los límites serán:
0.279 – E = 0.279 – 0.023 = 0.256 y 0.279 + 0.023 = 0.302 . Es decir:
0.95 = P(0.256  p  0.302 ) Rpta.
Interpretación.- en el 95 % de las muestras de 1500 niños y niñas a nivel nacional,
la proporción de desnutridos crónicos se encontrará entre 0.256 y 0.302 alrededor
de la proporción verdadera P = 0.279.
47
2.5 DISTRIBUCIÓN MUESTRAL DEL TOTAL (conocida la proporción)
En muchas situaciones vamos a estar interesados en efectuar estimaciones de un
total poblacional, conocida la proporción muestral, para lo cual se tiene que tener
presente lo siguiente:
Sí
N
X
P
N
i
i
 1
representa la proporción (P) de unidades en la población que
poseen una cierta característica y 

N
i
iXA
1
el número total (A) de unidades que
poseen dicha característica. Entonces:
El total de la población se define como: NPXA
N
i
i  1
el cual es estimado por: NpPNA  ˆˆ
Utilizando la propiedad reproductiva de la distribución normal, el teorema
central del límite y los operadores esperanza y varianza para el estimador de
total, llegamos al resultado siguiente:
 22
,ˆˆ pNNPNNpPNA  y
pN
NPNp
Z


 ~ N(0, 1)
Donde la varianza del estimador del total está dada por:

n
PQ
NNpVarNNpVarPNVarAVar p
2222
)()()ˆ()ˆ(   , si la
fracción de muestreo f = n / N  0.05 , o
 








1
)()()ˆ()ˆ( 2222
N
nN
n
PQ
NNpVarNNpVarPNVarAVar p , si
la fracción de muestreo f = n / N > 0.05.
48
2.6 DISTRIBUCIÓN MUESTRAL DE LA DIFERENCIA DE
PROPORCIONES
Esta distribución surge cuando estemos interesados en efectuar la comparación de las
proporciones de dos poblaciones. Por ejemplo: comparar la proporción poblacional
de individuos que prefiere un bien o servicio en la ciudad 1 (P1 ) y la proporción
poblacional de individuos que prefiere el mismo bien o servicio en la ciudad 2 (P2 ).
Comparar las proporciones de aceptación no sólo entre ciudades, sino también entre
grupos.
Esta comparación se formula así: ¿Serán iguales las proporciones poblacionales de
individuos que prefieren un bien o servicio en las ciudades 1 y 2? Que es idéntico a
plantearse ¿ P1 = P2 o P1 – P2 = 0 ?
Es decir, que esta comparación se reduce a conocer la diferencia de proporciones
poblacionales, la misma que va a requerir tomar muestras aleatorias de ambas
poblaciones y estudiar el comportamiento de la proporción muestral en cada una de
ellas y de la diferencia p1 – p2 de la siguiente manera:
 Suponga que se extrae una muestra aleatoria simple de tamaño n1 de la población
binomial 1, de tamaño N1 con una proporción de éxitos igual a P1. Sea X1 el
número de éxitos en la muestra de tamaño n1 , entonces la proporción muestral de
éxitos p1 , definida como
1
1
1
n
X
p  estima a P1 y para n1 suficientemente
grande tiene aproximadamente distribución normal:
),( 2
11 1pPNp  . Donde:
1
112
1
n
QP
p  o 








11
11
1
112
1
N
nN
n
QP
p ..... (1)
 Suponga que se extrae una muestra aleatoria simple de tamaño n2 de la población
binomial 2, de tamaño N2 con una proporción de éxitos igual a P2. Sea X2 el
número de éxitos en la muestra de tamaño n2 , entonces la proporción muestral de
éxitos p2 , definida como
2
2
2
n
X
p  estima a P2 y para n2 suficientemente
grande tiene aproximadamente distribución normal:
49
),( 2
22 2pPNp  . Donde:
2
222
2
n
QP
p  o 








12
22
2
222
2
N
nN
n
QP
p .....
(2)
 Siendo p1 y p2 variables aleatorias independientes, cuyas distribuciones están
dadas en (1) y (2) tenemos que p1 – p2 es una variable aleatoria con media:
      212121 2121
PPpEpEppE pppp  
y varianza:
      22
2121
2
2121 pppp pVarpVarppVar  
2
21 pp  =
1
11
n
QP
+
2
22
n
QP
o 







11
11
1
11
N
nN
n
QP
+ 







12
22
2
22
N
nN
n
QP
............. (3)
Además, por la propiedad reproductiva de la distribución normal, de (1) y (2) se
tiene que:
p1 – p2 ~ N(P1 – P2 , 2
21 pp  ) y
21
)( 2121
pp
PPpp
Z




~ N(0 , 1)
donde 21 pp  se obtiene a partir de (3).
Sintetizamos lo expuesto hasta aquí en el teorema 6.
Teorema 6.- Si p1 y p2 son las proporciones de dos muestras aleatorias (de tamaños
n1 y n2 ) de las poblaciones binomiales 1 y 2, respectivamente, entonces la
distribución muestral de la diferencia de proporciones p1 - p2 ~ N(P1 – P2 , 2
21 pp  )
y la variable aleatoria
2
22
1
11
2121 )(
n
QP
n
QP
PPpp
Z


 o


















11
)(
2
22
2
22
1
11
1
11
2121
N
nN
n
QP
N
nN
n
QP
PPpp
Z tiene aproximadamente distribución
normal estándar N(0 , 1).
50
Si n1 y n2 son mayores o iguales que 30, la aproximación a la normal para la
diferencia de proporciones muestrales es óptima.
Ejemplo 6.-
Una empresa que trabaja en ciudades grandes, considera que el nivel de aceptación
de su producto en los hogares de la ciudad 1 es de un 35% y en la ciudad 2 de un
30%. Si se toma una muestra aleatoria de 400 hogares de cada ciudad. ¿Cuál es la
probabilidad que la diferencia de proporciones muestrales de hogares que prefieren el
producto en ambas ciudades sea menor al 8%? Interpretar el resultado.
Solución.-
P1 = 0.35 = proporción de hogares que prefiere el producto en la ciudad 1.
Q1 = 1 – P1 = 0.65 = proporción de hogares que no prefiere el producto en la ciudad
1.
P2 = 0.30 = proporción de hogares que prefiere el producto en la ciudad 2.
Q2 = 1 – P2 = 0.70 = proporción de hogares que no prefiere el producto en la ciudad
2.
n1 = n2 = 400 hogares (tamaño de la muestra en ambas ciudades)
Considerando que ambas ciudades son grandes y que las correspondientes fracciones
de muestreo son menores al 5% (f = n / N < 0.05) se tiene que:
p1 – p2 ~ N(P1 – P2 , 2
21 pp  )
Con media: 2121
PPpp  = 0.35 – 0.30 = 0.05
Y varianza: 2
21 pp  =
1
11
n
QP
+
2
22
n
QP
=
400
)65.0)(35.0(
400
)65.0)(35.0(
 = 0.0011 .
Luego:
p1 – p2 ~ N(0.05 ; 0.0011) y
0331.0
05.0)( 212121
21





ppPPpp
Z
pp
~ N(0 , 1)
51
Se pide calcular:
P (p1 – p2  0.08 ) = P(-0.08  p1 – p2  0.08) =
= 




 




0331.0
05.008.0
0331.0
05.0
0331.0
05.008.0 21 pp
P =
= P(-3.93  Z  0.91) =  (0.91) -  (-3.93) =
= 0.81859 – 0.00004 = 0.81855 Rpta.
Interpretación.- en el 81.86% de las comparaciones, para muestras de 400 hogares
de cada ciudad, las diferencias de proporciones muestrales de hogares que
prefieren el producto en ambas ciudades será menor al 8%.
52
2.7 EJERCICIOS RESUELTOS
1. Si se toma una muestra aleatoria de tamaño n, de una población X con
distribución Bernoulli, con parámetro p, hallar la función de probabilidad conjunta
(o de verosimilitud) para dicha muestra.
Solución
Si la variable aleatoria. X ~ Bernoulli (p), entonces cada Xi ~ Bernoulli (p) y su
función de probabilidad es: 1
( ) , 1,2,....,i ix x
X if x p q i n
   ; xi = 0 y 1.
Luego la función de probabilidad conjunta o de verosimilitud será:
1 2 1 2( , ,...., ) ( ) ( ).... ( )n X X X nf x x x f x f x f x  1 1x x
p q  
2 2x x
p q    .... n nx x
p q  
= 1 1
n n
i i
i i
x n x
p q 
 
, xi = 0 y 1;  i = 1, 2, .... , n . Rpta.
2. Si se toma una muestra aleatoria de tamaño m, de una población X con
distribución binomial, con parámetros n y p, hallar la función de probabilidad
conjunta (o de verosimilitud) para dicha muestra.
Solución
Como la variable aleatoria X ~ B(n, p), entonces cada Xi ~ B(n, p) y su función
de probabilidad es: ( ) , 1,2,....,i i
xi
x n x
X i nf x C p q i m
   ; xi = 0, 1, 2, 3, .... , n
Luego la función de probabilidad conjunta o de verosimilitud será:
1 2 1 2( , ,...., ) ( ) ( ).... ( )n X X X nf x x x f x f x f x 
= 1 1
1
x n x
n xC p q 
  
2 2
2
x n x
n xC p q 
    .... m m
m
x n x
n xC p q 
  
= 1 1
1
m m
i i
i i
i
m x m x
n x
i
C p q 


  
 
 
 , xi = 0, 1, 2,....,n;  i = 1, 2, ..., m .
Rpta.
3. Si se toma una muestra aleatoria de tamaño n, de una población X con
distribución de Pareto, con parámetro B, hallar la función de probabilidad
conjunta (o de verosimilitud) para dicha muestra.
53
Solución
Si la variable aleatoria. X ~ Pareto (B), entonces cada Xi ~ Pareto (B) y su función de
probabilidad es:
0
01
( ) , , 1,2,....,
B
X i iB
i
BX
f x X X i n
X 
    . Donde:
B = Coeficiente de Pareto > 0.
Xo = Ingreso mínimo.
Luego la función de probabilidad conjunta o de verosimilitud será:
1 2 1 2( , ,...., ) ( ) ( ).... ( )n X X X nf x x x f x f x f x 
0
1
1
B
B
BX
X 
 
 
 
0
1
1
B
B
BX
X 
 
 
 
 ....
0
1
1
B
B
BX
X 
 
 
 
0
0
1
1
; , 1,2,....,
n nB
in
B
i
i
B X
X X i n
X 

 
 
    
 
  
 , Rpta.
4. Si se toma una muestra aleatoria de tamaño n, de una población X con distribución
log-normal, con parámetros μ y σ2
, hallar la función de probabilidad conjunta (o de
verosimilitud) para dicha muestra.
Solución
Como la variable aleatoria X ~ LN (μ , σ2
), entonces cada Xi ~ LN (μ , σ2
) y su
función de probabilidad esta dada por:
2 2
(ln ) /2
2
1
( ) ; 0,
2
ix
X i i
i
f x e x
x
 

 
   i =
1, 2, ...., n.
Luego la función de densidad conjunta o de verosimilitud será:
1 2 1 2( , ,...., ) ( ) ( ).... ( )n X X X nf x x x f x f x f x 
=
2 2
1(ln ) /2
2
1
1
2
x
e
x
 

 
 
 
  
2 2
2(ln ) /2
2
2
1
2
x
e
x
 

 
 
 
  
 ....
2 2
(ln ) /2
2
1
2
nx
n
e
x
 

 
 
 
  
=
=
2 2
1
(ln ) /22
2
1
1 1
; 0,
2
n
i
i
n
x
in
i
i
e x
x
 


 

 
   

i = 1, 2, 3, .... , n. Rpta.
54
5. Las botellas de aceite para motor de carros tienen un contenido medio de 2.0 litros
y una desviación estándar de 0.12 litros. Si se toma una muestra aleatoria de 36
botellas, Calcule e interprete la probabilidad que:
a) Las botellas tengan una media de llenado entre 1.96 y 2.03 litros.
b) ¿Dentro de qué límites simétricos caerá el 95 % de las medias muestrales
alrededor de la media poblacional?
Solución
Los datos del problema son: μ = 2.0 lts., σ = 0.12 lts. y n = 36 botellas.
n
XVarX
2
2
)(

  = (0.12)2
/ 36 = 0.0004 X
  0.02 lts.
Luego: 2
( , )X
X N   = N(2.00, 0.0004) y
( 2.00)
(0,1)
0.02
X
Z N

  . Nos piden:
a) P(1.96  X  2.03) =
1.96 2.00 2.00 2.03 2.00
0.02 0.02 0.02
X
P
   
  
 
= P(-2.0  Z 
1.5)
=  (1.5) -  (-2.0) =
= 0.93319 – 0.02275 = 0.91044 Rpta.
20
15
10
5
0
X = media muestral
Densidad
1.96
0.9104
2.032.00
Distribución contenido medio de aceite
Normal, Media=2, Desv.Est.=0.02 lts.
Resultado gráfico en Minitab
55
Interpretación.- en el 91.04% de las (ó en 9104 de cada 10000) muestras de 36
botellas de aceite para motor de carro de dos litros, el contenido medio está entre
1.96 y 2.03 litros.
b) Sean 2.00 – E y 2.00 + E los límites simétricos alrededor de la media μ = 2.0 lts.,
dentro de los cuales estará el 95 % de las X . Entonces:
0.95 = P(2.00 – E  X  2.00 + E) = ( )
0.02 0.02
E E
P Z

  
= 2 1 0.975
0.02 0.02 0.02 0.02
E E E E
   
       
            
       
0.975
0.02
E
Z = 1.96 → E = 1.96 x 0.02 = 0.039 lts. Luego los límites serán:
2.00 – E = 2.00 – 0.039 = 1.961 lts. y 2.00 + 0.039 = 2.039 lts. Es decir:
0.95 = P(1.961  X  2.039) Rpta.
Interpretación.- en el 95% de las (ó en 9500 de cada 10000) muestras de 36
botellas de aceite para motor de carro de dos litros, el contenido medio está entre
1.961 y 2.039 lts. alrededor de μ = 2.0 lts.
6. Una estación de servicio de una ciudad grande ha encontrado que sus ventas
semanales de petróleo tienen un promedio de 15 galones por cliente con una
desviación estándar de 2.8. Para una muestra aleatoria de 49 clientes, calcule e
interprete:
a) La probabilidad de que la compra promedio semanal de petróleo sea menor de
14 galones;
b) ¿Dentro de qué límites simétricos caerá el 99% de las medias muestrales
alrededor de la media poblacional?
Solución
Los datos del problema son: μ = 15 glns., σ = 2.8 glns. y n = 49 clientes.
n
XVarX
2
2
)(

  = (2.8)2
/ 49 = 0.16 X
  0.4 glns.
56
Entonces: 2
( , )X
X N   = N(15, 0.16) y
( 15)
0.4
X
Z

  N(0, 1). Nos piden:
a) P( X < 14) =
15 14 15
0.4 0.4
X
P
  
 
 
= P(Z < -2.5) =  (-2.5) = 0.00621 Rpta.
Interpretación.- en el 0.621% de las (ó en 62 de cada 10000) muestras de 49
clientes de petróleo, la compra media es menor a 14 galones.
b) Sean 15 – E y 15 + E los límites simétricos alrededor de la media μ = 15
glns., dentro de los cuales caerá el 99 % de las X . Entonces:
0.99 = P(15 – E  X  15 + E) = ( )
0.4 0.4
E E
P Z

  
= 2 1 0.995
0.4 0.4 0.4 0.4
E E E E
   
       
            
       
0.995
0.4
E
Z = 2.575 → E = 2.575 x 0.4 = 1.03 glns. Luego los límites serán:
15 – E = 15 – 1.03 = 13.97 glns. y 15 + 1.03 = 16.03 glns. Es decir:
0.99 = P(13.97  X  16.03) Rpta.
1.0
0.8
0.6
0.4
0.2
0.0
X = media muestral
Densidad
13.97
0.99
16.0315
Normal, Media=15, Desv.Est.=0.4
Distribución compra media de petróleo
Resultado gráfico en Minitab
57
Interpretación.- en el 99% de las (ó en 9900 de cada 10000) muestras de 49
clientes de petróleo, la venta media se encuentra entre 13.97 y 16.03 glns.
alrededor de μ = 15 glns.
7. La compañía “Yapatera” vende bolsas de azúcar con un contenido medio de 5
kilos y una desviación estándar de 0.2 kilos. Si se toma muestras al azar de 36
bolsas. Calcule e interprete:
a) La probabilidad de que el peso medio de la muestra supere los 5.1 kilos.
b) ¿Dentro de que límites simétricos alrededor de la media poblacional caerá el
90% de los pesos medios muestrales?
Solución
Los datos del problema son: μ = 5 Kg., σ = 0.2 Kg. y n = 36 bolsas.
n
XVarX
2
2
)(

  = (0.2)2
/ 36 = 0.0011 X
  0.033 Kg.
Entonces: 2
( , )X
X N   = N(5, 0.0011) y
( 5)
0.033
X
Z

  N(0, 1). Se pide:
a) P( X > 5.1) =
5 5.1 5
0.033 0.033
X
P
  
 
 
= P(Z > 3.03) = 1 -  (3.03) =
= 1 - 0.99878 = 0.00122 Rpta.
Interpretación.- en el 0.12% de las (ó en 12 de cada 10000) muestras de 36 bolsas
de azúcar, el peso medio supera los 5.1 kilos.
b) Sean 5 – E y 5 + E los límites simétricos alrededor de la media μ = 5 Kg.,
dentro de los cuales caerá el 90 % de las X . Entonces:
0.90 = P(5 – E  X  5 + E) = ( )
0.033 0.033
E E
P Z

  
= 2 1 0.95
0.033 0.033 0.033 0.033
E E E E
   
       
            
       
0.95
0.033
E
Z = 1.645 → E = 1.645 x 0.033 = 0.054 Kg. Luego los límites serán:
58
5 – E = 5 – 0.054 = 4.946 Kg. y 5 + 0.054 = 5.054 Kg. Es decir:
0.90 = P(4.946  X  5.054) Rpta.
Interpretación.- en el 90% de las (ó en 9000 de cada 10000) muestras de 36
bolsas de azúcar, el contenido medio se encuentra entre 4.946 y 5.054 Kg.
alrededor de μ = 5 Kg.
8. En Lima el precio promedio al consumidor del kilo de arroz es μ = S/. 3.20 con
una desviación estándar σ = S/. 0.25. Si se selecciona una muestra aleatoria de 100
consumidores de arroz, calcule e interprete:
a) La probabilidad que el precio medio muestral del arroz sea mayor a S/. 3.25 el
kilo.
b) ¿Dentro de que límites simétricos caerá el 95% de los precios medios
muestrales alrededor de la media poblacional?
Solución
Los datos del problema son: μ = S/. 3.20, σ = S/. 0.25. y n = 100 consumidores.
n
XVarX
2
2
)(

  = (0.25)2
/ 100 = 0.000625 X
  S/. 0.025
Entonces: 2
( , )X
X N   = N(3.20, 0.000625) y
( 3.20)
0.025
X
Z

  N(0, 1). Se
pide:
a) P( X > 3.25) =
3.20 3.25 3.20
0.025 0.025
X
P
  
 
 
= P(Z > 2.0) = 1 -  (2.00) =
= 1 - 0.97725 = 0.02275 Rpta.
Interpretación.- en el 2.28% de las (ó en 228 de cada 10000) muestras de 100
consumidores de arroz, el precio medio del kilo es mayor a S/. 3.25.
b) Sean 3.20 – E y 3.20 + E los límites simétricos alrededor de la media μ = S/.
3.20, dentro de los cuales caerá el 95 % de las X . Entonces:
0.95 = P(3.20 – E  X  3.20 + E) = ( )
0.025 0.025
E E
P Z

  
59
= 2 1 0.975
0.025 0.025 0.025 0.025
E E E E
   
       
            
       
0.975
0.025
E
Z = 1.96 → E = 1.96 x 0.025 = S/. 0.05. Luego los límites serán:
3.20 – E = 3.20 – 0.05 = S/. 3.15 y 3.20 + 0.05 = S/. 3.25. Es decir:
0.95 = P(3.15  X 3.25) Rpta.
Interpretación.- en el 95% de las (ó en 9500 de cada 10000) muestras de 100
consumidores de arroz, el precio medio del kilo se encuentra entre 3.15 y 3.25
nuevos soles alrededor de μ = S/. 3.20.
9. La compañía “La negrita” vende latas de café con un contenido medio de 195
gramos y una desviación estándar de 6 gramos. Si se toman muestras al azar de 25
latas. Calcule e interprete:
a) La probabilidad de que el peso medio de la muestra sea menor de 192
gramos.
b) ¿Dentro de que límites simétricos alrededor de la media poblacional caerá el
99.73% de los pesos medios muestrales?
Solución
Los datos del problema son: μ = 195 gr., σ = 6 gr. y n = 25 latas.
n
XVarX
2
2
)(

  = (6)2
/ 25 = 1.44 X
  1.2 gr.
Entonces: 2
( , )X
X N   = N(195, 1.44) y
( 195)
1.2
X
Z

  N(0, 1). Se pide:
a) P( X < 192) =
195 192 195
1.2 1.2
X
P
  
 
 
= P(Z < -2.5) =  (-2.50) = 0.00621
Interpretación.- en el 0.62% de las (ó en 62 de cada 10000) muestras de 25
latas de café, el peso medio es menor 192 gr.
b) Sean 195 – E y 195 + E los límites simétricos alrededor de la media μ = 195
gr, dentro de los cuales caerá el 99.73 % de las X . Entonces:
60
0.9973 = P(195 – E  X  195 + E) = ( )
1.2 1.2
E E
P Z

  
= 2 1 0.99865
1.2 1.2 1.2 1.2
E E E E
   
       
            
       
0.99865
1.2
E
Z = 3.0 → E = 3 x 1.2 = 3.6 gr. Luego los límites serán:
195 – E = 3.6 – 0.05 = 191.4 gr. y 195 + 3.6 = 198.6 gr. Es decir:
0.9973 = P(191.4  X  198.6) Rpta.
Interpretación.- en el 99.73% de las (ó en 9973 de cada 10000) muestras de 25
latas de café, el peso medio se encuentra entre 191.4 y 198.6 gr. alrededor de μ =
195 gr.
10. Se sabe que en la ciudad A el gasto medio mensual en arbitrios es de S/. 250, con
una desviación típica de S/. 60; mientras que en la ciudad B dicho gasto medio
mensual es de S/. 235, con una desviación típica de S/. 50. En una auditoría para
determinar el gasto medio mensual en arbitrios en las ciudades A y B, se toma una
muestra al azar de 300 hogares de cada ciudad. Calcule e interprete la
probabilidad de que:
a) El gasto medio mensual en arbitrios en la ciudad B sea mayor que en la ciudad
A.
b) El gasto medio mensual en arbitrios en la ciudad A sea al menos S/. 25 más
que el gasto medio mensual en arbitrios en la ciudad B.
Solución
Los datos del problema son: μA = S/. 250, σA = S/. 35 y nA = 300 hogares.
μB = S/. 235, σA = S/. 20 y nB = 300 hogares. Luego:
2 2
2 (60)
( )
300A
A
AX
A
Var X
n

    = 12.00 y
2 2
2 (50)
( )
300B
B
BX
B
Var X
n

    = 8.33
61
A B A BX X
  
  = 250 - 235 = 15, 2 2 2
A BA B x xX X
  
  = 12 + 8.33 = 20.33 y
A BX X
 
= 4.51. Luego:
2
( , )A BA B A B X X
X X N    
   = N(15, 20.33) y
( 15)
4.51
A BX X
Z
 
  N(0, 1).
Se pide:
a) P( BX > AX ) = P( AX < BX ) = P( AX - BX < 0) =
( 15) 0 15
4.51 4.51
A BX X
P
   
 
 
=
= P(Z < -3.33) =  (-3.33) = 0.00043 Rpta.
Interpretación.- en el 0.04% de las (ó en 4 de cada 10000) muestras de 300
hogares de cada ciudad, el gasto medio mensual en arbitrios en la ciudad B será
mayor que en la ciudad A.
b)  25A BP X X  = 1 -  25A BP X X  = 1 -
15 25 15
4.51 4.51
A BX X
P
   
 
 
=
= 1 – P(Z < 2.22) = 1 -  (2.22) =
= 1 – 0.98679 = 0.01321 Rpta.
Interpretación.- en el 1.32% de las (ó en 132 de cada 10000) muestras de 300
hogares de cada ciudad, el gasto medio mensual en arbitrios en la ciudad A
será al menos S/. 25 más que el gasto medio mensual en arbitrios en la ciudad
B.
11. Dos fábricas A y B productoras de bombillas afirman que el promedio de
duración de ellas es de 1980 y 1950 horas, respectivamente, con desviaciones
típicas de 90 y 100 horas. Si se seleccionan 100 bombillas al azar de cada fábrica,
calcule e interprete la probabilidad de que:
a) Las bombillas B tengan una duración media menor de 1930 horas.
b) Las bombillas B tengan una duración media mayor que la duración media de
las bombillas A.
62
Solución
Los datos del problema son: μA = 1980 horas, σA = 90 horas y nA = 100 bombillas.
μB = 1950 horas, σB = 100 horas y nB = 100 bombillas. Luego:
2
2
( )A
A
AX
A
Var X
n

   = (90)2
/ 100 = 81 y
2
2
( )B
B
BX
B
Var X
n

   = (100)2
/ 100 =
100
a) 2
( , )BB B X
X N   = N(1950, 81) y
( 1950)
9
BX
Z

  N(0, 1). Se pide:
P( BX < 1930) =
1950 1930 1950
9 9
BX
P
  
 
 
= P(Z < -2.22) =
=  (-2.22) = 0.01321 Rpta.
Interpretación.- en el 1.32% de las (ó en 132 de cada 10000) muestras de 100
bombillas B, la duración media menor de 1930 horas.
b) A B A BX X
  
  = 1980 - 1950 = 30, 2 2 2
A BA B x xX X
  
  = 81 + 100 = 181 y
A BX X
 
= 13.45. Luego:
2
( , )A BA B A B X X
X X N    
   = N(30, 181) y
( 30)
13.45
A BX X
Z
 
  N(0,
1). Se pide:
P( BX > AX ) = P( AX < BX ) = P( AX - BX < 0) =
( 30) 0 30
13.45 13.45
A BX X
P
   
 
 
=
= P(Z < -2.23) =  (-2.23) = 0.01287 Rpta.
Interpretación.- en el 1.29% de las (ó en 129 de cada 10000) muestras de 100
bombillas A y 100 bombillas B, la duración media de las bombillas B es mayor
que la duración media de las bombillas A.
12. Un proceso automático es realizado por dos máquinas que empaquetan un
producto en bolsas de 500 gramos. La máquina 1 llena con una desviación
estándar de 15 gramos y la máquina 2 de 20 gramos. Si se seleccionan muestras
de 100 bolsas de cada máquina, calcule e interprete la probabilidad de que:
a) El llenado medio de la máquina 1 sea menor que el llenado medio de la máq.
2.
63
b) Las medias muestrales difieran en menos de 2 gramos.
Solución
Los datos del problema son: μ1 = 500 gr., σ1 = 15 gr. y n1 = 100 bolsas.
μ2 = 500 gr., σ2 = 20 gr. y n2 = 100 bolsas. Luego:
1
2
2 1
1
1
( )X
Var X
n

   = (15)2
/ 100 = 2.25 y 2
2
2 2
2
2
( )X
Var X
n

   = (20)2
/ 100 = 4.
1 2 1 2X X
  
  = 500 - 500 = 0, 1 21 2
2 2 2
x xX X
  
  = 2.25 + 4 = 6.25 y
A BX X
 
= 2.5. Luego:
1 2
2
1 2 1 2( , )X X
X X N    
   = N(0, 6.25) y 1 2( 0)
2.5
X X
Z
 
  N(0, 1). Se pide:
a) P( 1X < 2X ) = P( 1X - 2X < 0) = 1 2( 0) 0 0
2.5 2.5
X X
P
   
 
 
=
= P(Z < 0) =  (0) = 0.5000 Rpta.
Interpretación.- en el 50% de las (ó en 5000 de cada 10000) muestras de 100
bolsas de la máquina 1 y 100 bolsas de la máquina 2, el llenado medio de la
máquina 1 es menor que el llenado medio de la máquina 2.
b)  1 2 2P X X  =  1 22 2P X X    = 1 2 02 0 2 0
2.5 2.5 2.5
X X
P
    
  
 
=
= P(-0.80 < Z < 0.80) = 2  (0.80) - 1 =
= 2 (0.78814) – 1 = 0.57628 Rpta.
Interpretación.- en el 57.63% de las (ó en 5763 de cada 10000) muestras de
100 bolsas de cada máquina, las medias muestrales difieren en 2 gramos.
13. Según un estudio del Ministerio de Salud,2
en el Perú los varones de 9 años de
edad tienen un peso promedio de 26.8 Kg. y una desviación estándar de 2.5 Kg.,
mientras que las mujeres tienen un peso promedio de 26.7 Kg. y una desviación
estándar de 3.8 Kg. Si se toman independientemente dos muestras al azar sin
reposición, de n = 300 niños y m = 300 niñas. Calcule e interprete la probabilidad
de que:
2
Ministerio de Salud. Informe del estado nutricional en el Perú. Componente nutricional ENAHO-CENAN Julio 2009 – Junio 2010,
CENAN – INEI,.. Lima, Perú, 2011.
64
a) El peso promedio de los niños sea menor que el peso promedio de las niñas.
b) El peso promedio de los niños sea al menos 0.6 kg. más que el peso promedio
de las niñas.
Solución
Los datos del problema son: μv = 26.8 Kg., σv = 2.5 Kg. y nv = 300 niños.
μm = 26.7 Kg., σm = 3.8 Kg. y nm = 300 niñas. Luego:
2
2
( )v
v
vX
v
Var X
n

   = (2.5)2
/ 300 = 0.02083 y
2
2
( )m
m
mX
m
Var X
n

   = (3.8)2
/ 300 = 0.04813.
v m v mX X
  
  = 26.8 – 26.7 = 0.1, 2 2 2
v mv m x xX X
  
  = 0.06896 y
v mX X
  = 0.2626. Luego:
2
( , )v mv m v m X X
X X N    
   = N(0.1, 0.2626) y
( 0.1)
0.2626
v mX X
Z
 
  N(0,
1). Se pide:
a) P( vX < mX ) = P( vX - mX < 0) =
( 0.1) 0 0.1
0.2626 0.2626
v mX X
P
   
 
 
=
= P(Z < -0.38) =  (-0.38) = 0.35197 Rpta.
Interpretación.- en el 35.2% de las (ó en 3520 de cada 10000) muestras de 300
niños y 300 niñas peruanos de 9 años de edad, el peso promedio de los niños
es menor que el peso promedio de las niñas.
b)  0.6v mP X X  = 1 -  0.6v mP X X  = 1 -
0.1 0.6 0.1
0.2626 0.2626
v mX X
P
   
 
 
=
= 1 – P(Z < 1.90) = 1 -  (1.90) =
= 1 – 0.97128 = 0.02872 Rpta.
Interpretación.- en el 2.87% de las (ó en 287 de cada 10000) muestras de 300
niños y 300 niñas peruanos de 9 años de edad, el peso promedio de los niños
será al menos 0.6 kg. más que el peso promedio de las niñas.
14. Una empresa azucarera embolsa azúcar con un contenido medio de 50 kg. y
desviación estándar de 0.5 kg. Para el control de calidad se toman muestras
65
aleatorias de 25 bolsas de la producción diurna y 50 de la producción nocturna.
Calcule e interprete la probabilidad de que la producción media de las bolsas de
ambos turnos difieran en menos de 0.2 kg.
Solución
Los datos del problema son: μ1 = 50 Kg., σ1 = 0.5 Kg. y n1 = 25 bolsas.
μ2 = 50 Kg., σ2 = 0.5 Kg. y n2 = 50 bolsas. Luego:
1
2
2 1
1
1
( )X
Var X
n

   = (0.5)2
/ 25 = 0.01 y 2
2
2 2
2
2
( )X
Var X
n

   = (0.5)2
/ 50 =
0.005
1 2 1 2X X
  
  = 50 - 50 = 0, 1 21 2
2 2 2
x xX X
  
  = 0.010 + 0.005 = 0.015 y
A BX X
  = 0.1225. Luego:
1 2
2
1 2 1 2( , )X X
X X N    
   = N(0, 0.015) y 1 2( 0)
0.1225
X X
Z
 
  N(0, 1). Se
pide:
 1 2 0.2P X X  =  1 20.2 0.2P X X    =
= 1 2 00.2 0 0.2 0
0.1225 0.1225 0.1225
X X
P
    
  
 
=
= P(-1.63 < Z < 1.63) = 2  (1.63) - 1 =
= 2 (0.94845) – 1 = 0.8969 Rpta.
Interpretación.- en el 89.69% de las (ó en 8969 de cada 10000) muestras de 25
bolsas de la producción diurna y 50 de la producción nocturna, la producción
media de las bolsas de ambos turnos difieren en menos de 0.2 kg.
15. En las tiendas Metro el 70 % de las compras es en alimentos y bebidas. Si se
seleccionan muestras aleatorias de 200 compras. Calcule e interprete:
a) La probabilidad de que el porcentaje de compras en alimentos y bebidas sea
mayor al 80%.
b) ¿entre que límites simétricos alrededor del verdadero porcentaje de compras
en alimentos y bebidas caerá el 99% de los porcentajes muestrales?
Solución
Los datos del problema son: P = 0.70 = proporción de las compras en alimentos y
bebidas en las tiendas Metro, Q = 0.30, n = 200 compras = tamaño de la muestra.
66
Asumiendo un número muy grande de compradores, entonces, la proporción muestral:
1
,
n
i
i
X
X PQ
p N P
n n n
  
    
 

= N(0.70; 0.00105) y
0.70 0.70
0.03240.00105
p P p p
Z
PQ
n
  
   ~ N(0, 1). Se pide calcular:
a) P (p > 0.80 ) = 1 - P (p ≤ 0.80 ) = 1 -
0.70 0.80 0.70
0.0324 0.0324
p
P
  
 
 
= 1 - P(Z  3.09) = 1 -  (3.09) = 1- 0.9990 = 0.0010 Rpta.
Interpretación.- en el 0.10 % de las (ó en 10 de cada 10000) muestras de 200
compras en las tiendas Metro, el porcentaje de compras en alimentos y bebidas es
mayor al 80%.
b) Sean 0.70 – E y 0.70 + E los límites simétricos alrededor de la proporción
verdadera P = 0.70, dentro de los cuales estará el 99 % de las p (proporciones
muestrales). Entonces:
0.99 = P(0.70 – E  p  0.70 + E) = ( )
0.0324 0.0324
E E
P Z

  =
= 2 1 0.995
0.0324 0.0324 0.0324 0.0324
E E E E
   
       
            
       
0.995 2.575 2.575(0.0324) 0.083
0.0324
E
Z E     . Luego los límites serán:
0.70 – E = 0.70 – 0.083 = 0.617 y 0.70 + 0.083 = 0.783. Es decir:
0.99 = P(0.617  p  0.783) Rpta.
Interpretación.- en el 99% de las (ó en 9900 de cada 10000) muestras de 200
compras en las tiendas Metro, el porcentaje de compras en alimentos y
bebidas se encuentra entre 61.7% y 78.3% alrededor de la proporción
verdadera P = 0.70.
16. El 40% de los clientes de las tiendas Saga son varones. Si se toma una muestra
aleatoria de 200 clientes. Calcule e interprete:
a) La probabilidad que el porcentaje de clientes varones esté entre 36% y 45%.
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie
Pie

Más contenido relacionado

La actualidad más candente

Guia intervalos de confianza
Guia intervalos de confianzaGuia intervalos de confianza
Guia intervalos de confianzaAndres Oyarzun
 
Distribuciones de probabilidad con ejemplos
Distribuciones de probabilidad con ejemplosDistribuciones de probabilidad con ejemplos
Distribuciones de probabilidad con ejemplosamy Lopez
 
Mapa conceptual tipos de distribuciones de probabilidad
Mapa conceptual   tipos de distribuciones de probabilidadMapa conceptual   tipos de distribuciones de probabilidad
Mapa conceptual tipos de distribuciones de probabilidadJose Hernandez Landa
 
Tarea 15 de PROBABILIDAD Y ESTADISTICA CON RESPUESTAS
Tarea 15 de PROBABILIDAD Y ESTADISTICA CON RESPUESTASTarea 15 de PROBABILIDAD Y ESTADISTICA CON RESPUESTAS
Tarea 15 de PROBABILIDAD Y ESTADISTICA CON RESPUESTASIPN
 
Tarea 8 de probabilidad y estadística con respuestas
Tarea 8 de probabilidad y estadística  con respuestasTarea 8 de probabilidad y estadística  con respuestas
Tarea 8 de probabilidad y estadística con respuestasIPN
 
Tarea 11 de probabilidad y estadistica con respuestas
Tarea 11 de probabilidad y estadistica con respuestasTarea 11 de probabilidad y estadistica con respuestas
Tarea 11 de probabilidad y estadistica con respuestasIPN
 
Variables aleatorias y distribución de probabilidad
Variables aleatorias y distribución de probabilidadVariables aleatorias y distribución de probabilidad
Variables aleatorias y distribución de probabilidadBlanca Parra Campos
 
Trabajo probabilidad
Trabajo probabilidadTrabajo probabilidad
Trabajo probabilidadFreddy Adrian
 
Prueba de hipotesis estadistica aplicada a la ingenieria
Prueba de hipotesis estadistica aplicada a la ingenieriaPrueba de hipotesis estadistica aplicada a la ingenieria
Prueba de hipotesis estadistica aplicada a la ingenieriaHector García Cárdenas
 
Tarea 16 de probabilidad y estadistica con respuestas
Tarea 16 de probabilidad y estadistica  con respuestasTarea 16 de probabilidad y estadistica  con respuestas
Tarea 16 de probabilidad y estadistica con respuestasIPN
 
Problemas resueltos de distribución muestral
Problemas resueltos de distribución muestralProblemas resueltos de distribución muestral
Problemas resueltos de distribución muestralasrodriguez75
 
Problemas de determinación de tamaño de la muestra (9)
Problemas de determinación de tamaño de la muestra (9)Problemas de determinación de tamaño de la muestra (9)
Problemas de determinación de tamaño de la muestra (9)Luz Hernández
 
T de student para dos muestras independientes
T de student para dos muestras independientesT de student para dos muestras independientes
T de student para dos muestras independientesJoseph AB
 
Ejercicios de prueba de hipotesis con 𝜎 desconocida (10)
Ejercicios de prueba de hipotesis con 𝜎 desconocida (10) Ejercicios de prueba de hipotesis con 𝜎 desconocida (10)
Ejercicios de prueba de hipotesis con 𝜎 desconocida (10) Luz Hernández
 

La actualidad más candente (20)

Guia intervalos de confianza
Guia intervalos de confianzaGuia intervalos de confianza
Guia intervalos de confianza
 
Distribuciones de probabilidad con ejemplos
Distribuciones de probabilidad con ejemplosDistribuciones de probabilidad con ejemplos
Distribuciones de probabilidad con ejemplos
 
Mapa conceptual tipos de distribuciones de probabilidad
Mapa conceptual   tipos de distribuciones de probabilidadMapa conceptual   tipos de distribuciones de probabilidad
Mapa conceptual tipos de distribuciones de probabilidad
 
Distribuciones
DistribucionesDistribuciones
Distribuciones
 
Tarea 15 de PROBABILIDAD Y ESTADISTICA CON RESPUESTAS
Tarea 15 de PROBABILIDAD Y ESTADISTICA CON RESPUESTASTarea 15 de PROBABILIDAD Y ESTADISTICA CON RESPUESTAS
Tarea 15 de PROBABILIDAD Y ESTADISTICA CON RESPUESTAS
 
Tarea 8 de probabilidad y estadística con respuestas
Tarea 8 de probabilidad y estadística  con respuestasTarea 8 de probabilidad y estadística  con respuestas
Tarea 8 de probabilidad y estadística con respuestas
 
Tarea 11 de probabilidad y estadistica con respuestas
Tarea 11 de probabilidad y estadistica con respuestasTarea 11 de probabilidad y estadistica con respuestas
Tarea 11 de probabilidad y estadistica con respuestas
 
Variables aleatorias y distribución de probabilidad
Variables aleatorias y distribución de probabilidadVariables aleatorias y distribución de probabilidad
Variables aleatorias y distribución de probabilidad
 
Trabajo probabilidad
Trabajo probabilidadTrabajo probabilidad
Trabajo probabilidad
 
Prueba de hipotesis estadistica aplicada a la ingenieria
Prueba de hipotesis estadistica aplicada a la ingenieriaPrueba de hipotesis estadistica aplicada a la ingenieria
Prueba de hipotesis estadistica aplicada a la ingenieria
 
Ejer terorema dlimite central
Ejer terorema dlimite centralEjer terorema dlimite central
Ejer terorema dlimite central
 
Distribuciones de muestreo
Distribuciones de muestreoDistribuciones de muestreo
Distribuciones de muestreo
 
Tarea 16 de probabilidad y estadistica con respuestas
Tarea 16 de probabilidad y estadistica  con respuestasTarea 16 de probabilidad y estadistica  con respuestas
Tarea 16 de probabilidad y estadistica con respuestas
 
Distribución norma ejercicio
Distribución norma ejercicioDistribución norma ejercicio
Distribución norma ejercicio
 
Variable aleatoria
Variable aleatoriaVariable aleatoria
Variable aleatoria
 
Clase8-Estadística
Clase8-EstadísticaClase8-Estadística
Clase8-Estadística
 
Problemas resueltos de distribución muestral
Problemas resueltos de distribución muestralProblemas resueltos de distribución muestral
Problemas resueltos de distribución muestral
 
Problemas de determinación de tamaño de la muestra (9)
Problemas de determinación de tamaño de la muestra (9)Problemas de determinación de tamaño de la muestra (9)
Problemas de determinación de tamaño de la muestra (9)
 
T de student para dos muestras independientes
T de student para dos muestras independientesT de student para dos muestras independientes
T de student para dos muestras independientes
 
Ejercicios de prueba de hipotesis con 𝜎 desconocida (10)
Ejercicios de prueba de hipotesis con 𝜎 desconocida (10) Ejercicios de prueba de hipotesis con 𝜎 desconocida (10)
Ejercicios de prueba de hipotesis con 𝜎 desconocida (10)
 

Destacado

Solucionario libro: Probabilidad y estadística para ingenieros 6 ed - walpole
Solucionario libro: Probabilidad y estadística para ingenieros 6 ed - walpoleSolucionario libro: Probabilidad y estadística para ingenieros 6 ed - walpole
Solucionario libro: Probabilidad y estadística para ingenieros 6 ed - walpoleMiguel Leonardo Sánchez Fajardo
 
50 ejercicios estadistica
50 ejercicios estadistica50 ejercicios estadistica
50 ejercicios estadisticaPAHOLA24
 
Ejerccios de curva normal
Ejerccios de curva normalEjerccios de curva normal
Ejerccios de curva normalCily Vasquez
 
Cuaderno probabilidad1
Cuaderno  probabilidad1Cuaderno  probabilidad1
Cuaderno probabilidad1GHCHASAN
 
Manual para crear páginas web en word 2010
Manual para crear páginas web en word 2010Manual para crear páginas web en word 2010
Manual para crear páginas web en word 2010Yescas16
 
Estimadores puntuales intervalos de confianza.
Estimadores puntuales   intervalos de confianza.Estimadores puntuales   intervalos de confianza.
Estimadores puntuales intervalos de confianza.maryanbalmaceda
 
Métodos no paramétricos (wilcoxon)
Métodos no paramétricos (wilcoxon)Métodos no paramétricos (wilcoxon)
Métodos no paramétricos (wilcoxon)IPMEDIA
 
Proyecto ecologico.
Proyecto ecologico.Proyecto ecologico.
Proyecto ecologico.LaloSLuna
 
Proyecto ecologia y medio ambiente 2012 ok.
Proyecto ecologia y medio ambiente 2012 ok.Proyecto ecologia y medio ambiente 2012 ok.
Proyecto ecologia y medio ambiente 2012 ok.Ro Va Que
 
Modulo Estadística 2011
Modulo Estadística 2011Modulo Estadística 2011
Modulo Estadística 2011cesarzatta
 
Estudio de los conceptos de la probabilidad
Estudio de los conceptos de la probabilidadEstudio de los conceptos de la probabilidad
Estudio de los conceptos de la probabilidadDaday Rivas
 

Destacado (15)

Solucionario libro: Probabilidad y estadística para ingenieros 6 ed - walpole
Solucionario libro: Probabilidad y estadística para ingenieros 6 ed - walpoleSolucionario libro: Probabilidad y estadística para ingenieros 6 ed - walpole
Solucionario libro: Probabilidad y estadística para ingenieros 6 ed - walpole
 
estadistica medias muestrales
estadistica medias muestralesestadistica medias muestrales
estadistica medias muestrales
 
50 ejercicios estadistica
50 ejercicios estadistica50 ejercicios estadistica
50 ejercicios estadistica
 
Ejerccios de curva normal
Ejerccios de curva normalEjerccios de curva normal
Ejerccios de curva normal
 
Cuaderno probabilidad1
Cuaderno  probabilidad1Cuaderno  probabilidad1
Cuaderno probabilidad1
 
Manual para crear páginas web en word 2010
Manual para crear páginas web en word 2010Manual para crear páginas web en word 2010
Manual para crear páginas web en word 2010
 
Estimadores puntuales intervalos de confianza.
Estimadores puntuales   intervalos de confianza.Estimadores puntuales   intervalos de confianza.
Estimadores puntuales intervalos de confianza.
 
Métodos no paramétricos (wilcoxon)
Métodos no paramétricos (wilcoxon)Métodos no paramétricos (wilcoxon)
Métodos no paramétricos (wilcoxon)
 
Pruebas no parametricas de wilcoxon 2007.
Pruebas no parametricas de wilcoxon 2007.Pruebas no parametricas de wilcoxon 2007.
Pruebas no parametricas de wilcoxon 2007.
 
Pruebas No Parametricas
Pruebas No ParametricasPruebas No Parametricas
Pruebas No Parametricas
 
Proyecto ecologico.
Proyecto ecologico.Proyecto ecologico.
Proyecto ecologico.
 
Proyecto ecologia y medio ambiente 2012 ok.
Proyecto ecologia y medio ambiente 2012 ok.Proyecto ecologia y medio ambiente 2012 ok.
Proyecto ecologia y medio ambiente 2012 ok.
 
Modulo Estadística 2011
Modulo Estadística 2011Modulo Estadística 2011
Modulo Estadística 2011
 
Probabilidades-Estadistica
Probabilidades-EstadisticaProbabilidades-Estadistica
Probabilidades-Estadistica
 
Estudio de los conceptos de la probabilidad
Estudio de los conceptos de la probabilidadEstudio de los conceptos de la probabilidad
Estudio de los conceptos de la probabilidad
 

Similar a Pie

S02.s1 Estadistica Inferencial Distribucion Muestral.pptx
S02.s1 Estadistica Inferencial  Distribucion Muestral.pptxS02.s1 Estadistica Inferencial  Distribucion Muestral.pptx
S02.s1 Estadistica Inferencial Distribucion Muestral.pptxBruceLpezMelgar
 
S02.s1 Estadistica Inferencial Distribucion Muestral.pdf
S02.s1 Estadistica Inferencial  Distribucion Muestral.pdfS02.s1 Estadistica Inferencial  Distribucion Muestral.pdf
S02.s1 Estadistica Inferencial Distribucion Muestral.pdfBruceLpezMelgar
 
distribucion_normal (1).pdf
distribucion_normal (1).pdfdistribucion_normal (1).pdf
distribucion_normal (1).pdfVaneZa GoMez
 
Estadística Inferencial Semana 1.pptx
Estadística Inferencial Semana 1.pptxEstadística Inferencial Semana 1.pptx
Estadística Inferencial Semana 1.pptxDailitGonzlezCapote2
 
Ensayo ent # 2 densidades probabilisticas
Ensayo ent # 2   densidades probabilisticasEnsayo ent # 2   densidades probabilisticas
Ensayo ent # 2 densidades probabilisticasGERENCIA MTTO 3ER CORTE
 
Probabilidad y estadística descriptiva
Probabilidad y estadística descriptivaProbabilidad y estadística descriptiva
Probabilidad y estadística descriptivaBlanca Parra Campos
 
Econometria i preguntas iniciales - parte 2
Econometria i   preguntas iniciales - parte 2Econometria i   preguntas iniciales - parte 2
Econometria i preguntas iniciales - parte 2Jorge Icabalceta
 
Problemas resueltos-de-dist-normal1
Problemas resueltos-de-dist-normal1Problemas resueltos-de-dist-normal1
Problemas resueltos-de-dist-normal1WilsonAdemirJinezInc
 
Geoestadistica UNAM, CLASE
Geoestadistica UNAM, CLASE Geoestadistica UNAM, CLASE
Geoestadistica UNAM, CLASE cristiam paul
 
4. Distribuciones de probabilidad.pptx
4. Distribuciones de probabilidad.pptx4. Distribuciones de probabilidad.pptx
4. Distribuciones de probabilidad.pptxGregoryGranados
 

Similar a Pie (20)

Distribución normal y t de student
Distribución normal y t de studentDistribución normal y t de student
Distribución normal y t de student
 
S02.s1 Estadistica Inferencial Distribucion Muestral.pptx
S02.s1 Estadistica Inferencial  Distribucion Muestral.pptxS02.s1 Estadistica Inferencial  Distribucion Muestral.pptx
S02.s1 Estadistica Inferencial Distribucion Muestral.pptx
 
S02.s1 Estadistica Inferencial Distribucion Muestral.pdf
S02.s1 Estadistica Inferencial  Distribucion Muestral.pdfS02.s1 Estadistica Inferencial  Distribucion Muestral.pdf
S02.s1 Estadistica Inferencial Distribucion Muestral.pdf
 
Distribución normal
Distribución normalDistribución normal
Distribución normal
 
distribucion_normal (1).pdf
distribucion_normal (1).pdfdistribucion_normal (1).pdf
distribucion_normal (1).pdf
 
Estadística Inferencial Semana 1.pptx
Estadística Inferencial Semana 1.pptxEstadística Inferencial Semana 1.pptx
Estadística Inferencial Semana 1.pptx
 
Ensayo ent # 2 densidades probabilisticas
Ensayo ent # 2   densidades probabilisticasEnsayo ent # 2   densidades probabilisticas
Ensayo ent # 2 densidades probabilisticas
 
7 distribucion normal
7 distribucion normal7 distribucion normal
7 distribucion normal
 
La prueba anova
La prueba anovaLa prueba anova
La prueba anova
 
Probabilidad y estadística descriptiva
Probabilidad y estadística descriptivaProbabilidad y estadística descriptiva
Probabilidad y estadística descriptiva
 
Econometria i preguntas iniciales - parte 2
Econometria i   preguntas iniciales - parte 2Econometria i   preguntas iniciales - parte 2
Econometria i preguntas iniciales - parte 2
 
Problemas resueltos-de-dist-normal1
Problemas resueltos-de-dist-normal1Problemas resueltos-de-dist-normal1
Problemas resueltos-de-dist-normal1
 
Problemas resueltos-de-dist-normal1
Problemas resueltos-de-dist-normal1Problemas resueltos-de-dist-normal1
Problemas resueltos-de-dist-normal1
 
Problemas resueltos-de-dist-normal1
Problemas resueltos-de-dist-normal1Problemas resueltos-de-dist-normal1
Problemas resueltos-de-dist-normal1
 
Dists de probab.pdf
Dists de probab.pdfDists de probab.pdf
Dists de probab.pdf
 
Geoestadistica UNAM, CLASE
Geoestadistica UNAM, CLASE Geoestadistica UNAM, CLASE
Geoestadistica UNAM, CLASE
 
Ensayo semana 4
Ensayo semana 4Ensayo semana 4
Ensayo semana 4
 
variables discretas y continuas
variables discretas y continuasvariables discretas y continuas
variables discretas y continuas
 
Medidas de tendencia_2013
Medidas de tendencia_2013Medidas de tendencia_2013
Medidas de tendencia_2013
 
4. Distribuciones de probabilidad.pptx
4. Distribuciones de probabilidad.pptx4. Distribuciones de probabilidad.pptx
4. Distribuciones de probabilidad.pptx
 

Último

41 RAZONES DE PORQUE SI ESTAMOS MAL EN MÉXICO
41 RAZONES DE PORQUE SI ESTAMOS MAL EN MÉXICO41 RAZONES DE PORQUE SI ESTAMOS MAL EN MÉXICO
41 RAZONES DE PORQUE SI ESTAMOS MAL EN MÉXICOlupismdo
 
Dino Jarach - El Hecho Imponible2024.pdf
Dino Jarach - El Hecho Imponible2024.pdfDino Jarach - El Hecho Imponible2024.pdf
Dino Jarach - El Hecho Imponible2024.pdfAdrianKreitzer
 
METODOS ESCALA SALARIAL EN ESTRUCTURAS.PPT
METODOS ESCALA SALARIAL EN ESTRUCTURAS.PPTMETODOS ESCALA SALARIAL EN ESTRUCTURAS.PPT
METODOS ESCALA SALARIAL EN ESTRUCTURAS.PPTrodrigolozanoortiz
 
Sistema_de_Abastecimiento en el peru.pptx
Sistema_de_Abastecimiento en el  peru.pptxSistema_de_Abastecimiento en el  peru.pptx
Sistema_de_Abastecimiento en el peru.pptxJUANJOSE145760
 
PRESUPUESTOS COMO HERRAMIENTA DE GESTION - UNIAGUSTINIANA.pptx
PRESUPUESTOS COMO HERRAMIENTA DE GESTION - UNIAGUSTINIANA.pptxPRESUPUESTOS COMO HERRAMIENTA DE GESTION - UNIAGUSTINIANA.pptx
PRESUPUESTOS COMO HERRAMIENTA DE GESTION - UNIAGUSTINIANA.pptxmanuelrojash
 
QUE REQUISITOS DEBO CUMPLIR PARA PENSIONARME.pdf
QUE REQUISITOS DEBO CUMPLIR PARA PENSIONARME.pdfQUE REQUISITOS DEBO CUMPLIR PARA PENSIONARME.pdf
QUE REQUISITOS DEBO CUMPLIR PARA PENSIONARME.pdflupismdo
 
Sistema de Control Interno aplicaciones en nuestra legislacion
Sistema de Control Interno aplicaciones en nuestra legislacionSistema de Control Interno aplicaciones en nuestra legislacion
Sistema de Control Interno aplicaciones en nuestra legislacionPedroSalasSantiago
 
PRUEBA PRE ICFES ECONOMIA. (4) - copia.doc
PRUEBA PRE ICFES ECONOMIA. (4) - copia.docPRUEBA PRE ICFES ECONOMIA. (4) - copia.doc
PRUEBA PRE ICFES ECONOMIA. (4) - copia.docmilumenko
 
El cheque 1 y sus tipos de cheque.pptx
El cheque  1 y sus tipos de  cheque.pptxEl cheque  1 y sus tipos de  cheque.pptx
El cheque 1 y sus tipos de cheque.pptxNathaliTAndradeS
 
puntos-clave-de-la-reforma-pensional-2023.pdf
puntos-clave-de-la-reforma-pensional-2023.pdfpuntos-clave-de-la-reforma-pensional-2023.pdf
puntos-clave-de-la-reforma-pensional-2023.pdfosoriojuanpablo114
 
LOS MIMBRES HACEN EL CESTO: AGEING REPORT.
LOS MIMBRES HACEN EL CESTO: AGEING  REPORT.LOS MIMBRES HACEN EL CESTO: AGEING  REPORT.
LOS MIMBRES HACEN EL CESTO: AGEING REPORT.ManfredNolte
 
MANUAL PARA OBTENER MI PENSIÓN O RETIRAR MIS RECURSOS.pdf
MANUAL PARA OBTENER MI PENSIÓN O RETIRAR MIS RECURSOS.pdfMANUAL PARA OBTENER MI PENSIÓN O RETIRAR MIS RECURSOS.pdf
MANUAL PARA OBTENER MI PENSIÓN O RETIRAR MIS RECURSOS.pdflupismdo
 
Análisis de la Temporada Turística 2024 en Uruguay
Análisis de la Temporada Turística 2024 en UruguayAnálisis de la Temporada Turística 2024 en Uruguay
Análisis de la Temporada Turística 2024 en UruguayEXANTE
 
TEMA 3 DECISIONES DE INVERSION Y FINANCIACION UNIVERISDAD REY JUAN CARLOS
TEMA 3 DECISIONES DE INVERSION Y FINANCIACION UNIVERISDAD REY JUAN CARLOSTEMA 3 DECISIONES DE INVERSION Y FINANCIACION UNIVERISDAD REY JUAN CARLOS
TEMA 3 DECISIONES DE INVERSION Y FINANCIACION UNIVERISDAD REY JUAN CARLOSreyjuancarlosjose
 
mercado de capitales universidad simon rodriguez - guanare (unidad I).pdf
mercado de capitales universidad simon rodriguez - guanare (unidad I).pdfmercado de capitales universidad simon rodriguez - guanare (unidad I).pdf
mercado de capitales universidad simon rodriguez - guanare (unidad I).pdfGegdielJose1
 
abrogar, clases de abrogacion,importancia y consecuencias
abrogar, clases de abrogacion,importancia y consecuenciasabrogar, clases de abrogacion,importancia y consecuencias
abrogar, clases de abrogacion,importancia y consecuenciasDeniseGonzales11
 
Principios de economia Mankiw 6 edicion.pdf
Principios de economia Mankiw 6 edicion.pdfPrincipios de economia Mankiw 6 edicion.pdf
Principios de economia Mankiw 6 edicion.pdfauxcompras5
 
Politicas publicas para el sector agropecuario en México.pptx
Politicas publicas para el sector agropecuario en México.pptxPoliticas publicas para el sector agropecuario en México.pptx
Politicas publicas para el sector agropecuario en México.pptxvladisse
 
Estructura y elaboración de un presupuesto financiero
Estructura y elaboración de un presupuesto financieroEstructura y elaboración de un presupuesto financiero
Estructura y elaboración de un presupuesto financieroMARTINMARTINEZ30236
 

Último (20)

41 RAZONES DE PORQUE SI ESTAMOS MAL EN MÉXICO
41 RAZONES DE PORQUE SI ESTAMOS MAL EN MÉXICO41 RAZONES DE PORQUE SI ESTAMOS MAL EN MÉXICO
41 RAZONES DE PORQUE SI ESTAMOS MAL EN MÉXICO
 
Dino Jarach - El Hecho Imponible2024.pdf
Dino Jarach - El Hecho Imponible2024.pdfDino Jarach - El Hecho Imponible2024.pdf
Dino Jarach - El Hecho Imponible2024.pdf
 
METODOS ESCALA SALARIAL EN ESTRUCTURAS.PPT
METODOS ESCALA SALARIAL EN ESTRUCTURAS.PPTMETODOS ESCALA SALARIAL EN ESTRUCTURAS.PPT
METODOS ESCALA SALARIAL EN ESTRUCTURAS.PPT
 
Sistema_de_Abastecimiento en el peru.pptx
Sistema_de_Abastecimiento en el  peru.pptxSistema_de_Abastecimiento en el  peru.pptx
Sistema_de_Abastecimiento en el peru.pptx
 
Mercado Eléctrico de Ecuador y España.pdf
Mercado Eléctrico de Ecuador y España.pdfMercado Eléctrico de Ecuador y España.pdf
Mercado Eléctrico de Ecuador y España.pdf
 
PRESUPUESTOS COMO HERRAMIENTA DE GESTION - UNIAGUSTINIANA.pptx
PRESUPUESTOS COMO HERRAMIENTA DE GESTION - UNIAGUSTINIANA.pptxPRESUPUESTOS COMO HERRAMIENTA DE GESTION - UNIAGUSTINIANA.pptx
PRESUPUESTOS COMO HERRAMIENTA DE GESTION - UNIAGUSTINIANA.pptx
 
QUE REQUISITOS DEBO CUMPLIR PARA PENSIONARME.pdf
QUE REQUISITOS DEBO CUMPLIR PARA PENSIONARME.pdfQUE REQUISITOS DEBO CUMPLIR PARA PENSIONARME.pdf
QUE REQUISITOS DEBO CUMPLIR PARA PENSIONARME.pdf
 
Sistema de Control Interno aplicaciones en nuestra legislacion
Sistema de Control Interno aplicaciones en nuestra legislacionSistema de Control Interno aplicaciones en nuestra legislacion
Sistema de Control Interno aplicaciones en nuestra legislacion
 
PRUEBA PRE ICFES ECONOMIA. (4) - copia.doc
PRUEBA PRE ICFES ECONOMIA. (4) - copia.docPRUEBA PRE ICFES ECONOMIA. (4) - copia.doc
PRUEBA PRE ICFES ECONOMIA. (4) - copia.doc
 
El cheque 1 y sus tipos de cheque.pptx
El cheque  1 y sus tipos de  cheque.pptxEl cheque  1 y sus tipos de  cheque.pptx
El cheque 1 y sus tipos de cheque.pptx
 
puntos-clave-de-la-reforma-pensional-2023.pdf
puntos-clave-de-la-reforma-pensional-2023.pdfpuntos-clave-de-la-reforma-pensional-2023.pdf
puntos-clave-de-la-reforma-pensional-2023.pdf
 
LOS MIMBRES HACEN EL CESTO: AGEING REPORT.
LOS MIMBRES HACEN EL CESTO: AGEING  REPORT.LOS MIMBRES HACEN EL CESTO: AGEING  REPORT.
LOS MIMBRES HACEN EL CESTO: AGEING REPORT.
 
MANUAL PARA OBTENER MI PENSIÓN O RETIRAR MIS RECURSOS.pdf
MANUAL PARA OBTENER MI PENSIÓN O RETIRAR MIS RECURSOS.pdfMANUAL PARA OBTENER MI PENSIÓN O RETIRAR MIS RECURSOS.pdf
MANUAL PARA OBTENER MI PENSIÓN O RETIRAR MIS RECURSOS.pdf
 
Análisis de la Temporada Turística 2024 en Uruguay
Análisis de la Temporada Turística 2024 en UruguayAnálisis de la Temporada Turística 2024 en Uruguay
Análisis de la Temporada Turística 2024 en Uruguay
 
TEMA 3 DECISIONES DE INVERSION Y FINANCIACION UNIVERISDAD REY JUAN CARLOS
TEMA 3 DECISIONES DE INVERSION Y FINANCIACION UNIVERISDAD REY JUAN CARLOSTEMA 3 DECISIONES DE INVERSION Y FINANCIACION UNIVERISDAD REY JUAN CARLOS
TEMA 3 DECISIONES DE INVERSION Y FINANCIACION UNIVERISDAD REY JUAN CARLOS
 
mercado de capitales universidad simon rodriguez - guanare (unidad I).pdf
mercado de capitales universidad simon rodriguez - guanare (unidad I).pdfmercado de capitales universidad simon rodriguez - guanare (unidad I).pdf
mercado de capitales universidad simon rodriguez - guanare (unidad I).pdf
 
abrogar, clases de abrogacion,importancia y consecuencias
abrogar, clases de abrogacion,importancia y consecuenciasabrogar, clases de abrogacion,importancia y consecuencias
abrogar, clases de abrogacion,importancia y consecuencias
 
Principios de economia Mankiw 6 edicion.pdf
Principios de economia Mankiw 6 edicion.pdfPrincipios de economia Mankiw 6 edicion.pdf
Principios de economia Mankiw 6 edicion.pdf
 
Politicas publicas para el sector agropecuario en México.pptx
Politicas publicas para el sector agropecuario en México.pptxPoliticas publicas para el sector agropecuario en México.pptx
Politicas publicas para el sector agropecuario en México.pptx
 
Estructura y elaboración de un presupuesto financiero
Estructura y elaboración de un presupuesto financieroEstructura y elaboración de un presupuesto financiero
Estructura y elaboración de un presupuesto financiero
 

Pie

  • 1. 1 UNIVERSIDAD NACIONAL DEL CALLAO VICERECTORADO DE INVESTIGACIÓN FACULTAD DECIENCIAS ECONÓMICAS TEXTODEPROBLEMASDE INFERENCIAESTADÍSTICA AUTOR: JUANFRANCISCOBAZÁNBACA (Resolución Rectoral 940-2011-R del 22-9-11) 01-09-11 al 31-08-13 CALLAO – PERÚ 2013
  • 2. 2 ÍNDICE Pág. INDICE 2 INTRODUCCIÓN 5 Capítulo 1. LA DISTRIBUCIÓN NORMAL Y EL TEOREMA DEL LÍMITE CENTRAL 6 1.1 Distribución normal 6 1.2 Distribución normal estándar 7 1.3 Propiedad reproductiva de la distribución normal 9 1.4 Teorema del límite central 10 1.5 Ejercicios resueltos 13 1.6 Ejercicios propuestos 29 Capítulo 2. DISTRIBUCIONES MUESTRALES 33 2.1 Distribución muestral de la media 37 2.2 Distribución muestral del total (conocida la media) 39 2.3 Distribución de la diferencia de medias muestrales 40 2.4 Distribución muestral de la proporción 43 2.5 Distribución muestral del total (conocida la proporción) 47 2.6 Distribución muestral de la diferencia de proporciones 48 2.7 Ejercicios resueltos 52 2.8 Ejercicios propuestos 73 Capítulo 3. DISTRIBUCIONES ESPECIALES 77 3.1 Distribución Chi-cuadrado 77 3.2 Distribución t de student 86 3.3 Distribución muestral de la media (n < 30) 92 3.4 Distribución de la diferencia de medias muestrales con varianzas desconocidas pero iguales 93 3.5 Distribución F de Snedecor 94 3.6 Distribución de la razón de dos varianzas muestrales 98 3.7 Ejercicios resueltos 100
  • 3. 3 3.8 Ejercicios propuestos 119 Capítulo 4. ESTIMACIÓN PUNTUAL 122 4.1 Estimadores. Propiedades 123 4.2 Métodos de Estimación Puntual 130 4.3 Método de Máxima Verosimilitud 130 4.4 Método de los Momentos 132 4.5 Método de los mínimos cuadrados 133 4.6 Ejercicios resueltos 135 4.7 Ejercicios propuestos 152 Capítulo 5. ESTIMACIÓN POR INTERVALOS DE CONFIANZA 155 5.1 Intervalo de confianza para la media y tamaño de muestra 160 5.2 Intervalo de confianza para el total (conocida la media) 162 5.3 Intervalo de confianza para la proporción y tamaño de muestra 164 5.4 Intervalo de confianza para el total (conocida la proporción) 167 5.5 Intervalo de confianza para la diferencia de medias 168 5.6 Intervalo de confianza para la diferencia de proporciones 170 5.7 Intervalo de confianza para la media (n < 30) 173 5.8 Intervalo de confianza para la varianza 175 5.9 Intervalo de confianza para la razón de varianzas 177 5.10 Intervalo de confianza para la diferencia de medias (n y m <30) 179 5.11 Ejercicios resueltos 187 5.12 Ejercicios propuestos 235 Capítulo 6. CONTRASTE DE HIPÓTESIS ESTADÍSTICAS PARAMÉTRICAS 245 6.1 Prueba de hipótesis para la media (con varianza conocida) 251 6.2 Prueba de hipótesis para la media (con varianza desconocida) 258 6.3 Prueba de hipótesis acerca de una varianza 263 6.4 Prueba de hipótesis para la razón de varianzas 270 6.5 Prueba de hipótesis acerca de dos medias (varianzas conocidas) 276 6.6 Prueba de hipótesis acerca de dos medias (varianzas desconocidas) 281 6.7 Prueba de hipótesis para la proporción 290
  • 4. 4 6.8 Prueba de hipótesis para la diferencia de proporciones 293 6.9 Ejercicios resueltos 299 6.10 Ejercicios propuestos 348 Capítulo 7. PRUEBA DE HIPÓTESIS NO PARAMÉTRICAS 355 7.1 Uso de la distribución Chi-cuadrado. Test de independencia 356 7.2 Test de bondad de ajuste 362 7.3 Test de Wilcoxon 364 7.4 Test de signos 367 7.5 Test de la mediana 374 7.6 Ejercicios resueltos 379 7.7 Ejercicios propuestos 395 REFERENCIAS BIBLIOGRÁFICAS 398 Apéndice 400 Tabla 1. Distribción acumulativa normal estándar 401 Tabla 2. Distribución acumulativa chi-cuadrado 403 Tabla 3. Distribución acumulativa T de student 407 Tabla 4. Distribución acumulativa F 408 Tabla 5. De Wilcoxon para n ≤ 40 y  = 0.05 o 0.01 409 Tabla 6. Valores críticos para la prueba del signo S 409
  • 5. 5 INTRODUCCIÓN La ciencia económica para poder realizar las mediciones económicas recurre permanentemente a la inferencia estadística, ya que las deducciones y conjeturas económicas acerca de los parámetros están basadas en muestras aleatorias tratadas por esta disciplina. Con el propósito de poder contribuir al proceso de enseñanza aprendizaje de la estadística para economistas en la Universidad Nacional del Callao (UNAC), hemos creído conveniente elaborar un “Texto de problemas de inferencia estadística” que de manera sencilla ayude a estudiantes de la especialidad a desarrollar competencias conceptuales y procedimentales, mediante la asimilación de la terminología propia de la estadística, así como las correspondientes aplicaciones a la economía. El texto consta de siete capítulos. En el primero, se desarrolla la distribución normal y el teorema del límite central; el capítulo dos, presenta las distribuciones muestrales para muestras grandes (n ≥ 30) y en el capítulo tres, se desarrollan las distribuciones muestrales especiales ligadas a muestras pequeñas (n < 30) como la chi-cuadrado, t de student y F. En los capítulos cuatro y cinco se desarrollan los temas relacionados a la estimación puntual y la estimación por intervalos de confianza respectivamente. En el capítulo seis, se desarrollan los contrastes de hipótesis estadísticas paramétricas, poniendo especial énfasis en la determinación del valor-P (probabilidad mínima para rechazar la hipótesis nula) usado en los cálculos computacionales modernos. Finalmente, en el capítulo siete se presentan las pruebas de hipótesis no paramétricas. Gratitud eterna a nuestra querida UNAC, por el continuo apoyo ofrecido para alcanzar estos logros que permiten sistematizar conocimientos e incorporar temas para la discusión en clases. El reconocimiento especial a los estudiantes de economía de la FCE-UNAC, ya que gracias a su esfuerzo y comprensión en los últimos años se han puesto en práctica los resultados de este modesto trabajo.
  • 6. 6 Capítulo 1. LA DISTRIBUCIÓN NORMAL Y EL TEOREMA CENTRAL DEL LÍMITE “Sólo cabe progresar cuando se piensa en grande, sólo es posible avanzar cuando se mira lejos”. José Ortega y Gasset CONTENIDO 1.1 Distribución normal. 1.2 Distribución normal estándar. 1.3 Propiedad reproductiva de la distribución normal. 1.4 Teorema del límite central. 1.5 Ejercicios resueltos. 1.6 Ejercicios propuestos. 1.1 DISTRIBUCIÓN NORMAL La teoría de probabilidades nos ofrece la distribución normal como una de las distribuciones más importantes, junto al teorema central del límite, con múltiples aplicaciones para la inferencia estadística, sobre todo en lo concerniente a las distribuciones muestrales. Por ello a continuación hacemos un breve repaso de la distribución normal y la presentación del teorema central del límite. Definición.- una variable aleatoria continua X tiene distribución normal con media μ y varianza σ2 , si su función de densidad de probabilidad esta dada por: 2 2 ( ) 2 2 1 ( ) 2 X f x e        - ∞ < x < ∞ donde: π = 3.14159265.... y e = 2.71828184 (la base de los logaritmos neperianos). Notación.- una notación muy común para la distribución normal es: X ~ N(μ , σ2 ) Que se lee “la variable aleatoria X se distribuye normalmente con media μ y varianza σ2 ”. Características geométricas.-  La gráfica tiene forma acampanada, con centro en μ.
  • 7. 7  Es una función creciente en el intervalo (- ∞ , μ).  Es una función decreciente en el intervalo (μ , ∞).  Tiene sus puntos de inflexión en μ – σ y μ + σ. Características estadísticas.-  Media: E (X) = μ  Varianza: V (X) = σ2  Si X ~ N(μ , σ2 ). Entonces, la variable aleatoria Y = a + b X también se distribuye normalmente con media: E(Y) = a + bμ y varianza: V(Y) = b2 σ2 . Es decir: Y ~ N(a + bμ , b2 σ2 )  Si X ~ N(μ , σ2 ) el cálculo de probabilidades se efectúa realizando el proceso de estandarización siguiente: Z = (X - μ ) / σ ~ N(0, 1) y decimos que la v.a. Z tiene distribución normal estándar. 1.2 DISTRIBUCIÓN NORMAL ESTÁNDAR Definición.- Se dice que una variable aleatoria Z, es una variable aleatoria normal estándar, si tiene distribución normal con media cero (μ = 0) y varianza uno (σ2 = 1) y su función de densidad de probabilidades es: 2/2 2 1 )( z ezf    - ∞ < z < ∞ La función de distribución acumulativa de Z se denota por Φ (z) o F(z) y se calcula así: 0 5 10 15 20 25 30 35 40 μ - 3σ μ - 2σ μ - σ μ μ + σ μ + 2σ μ + 3σ X DISTRIBUCIÓN NORMAL
  • 8. 8 Φ (z) = F(z) = P [Z  z] =   z t dte 2/2 2 1  Esta probabilidad nos da el área bajo la curva normal desde - ∞ hasta el valor z. Entonces, conocidos los valores de la media μ y la varianza σ2 de una variable aleatoria X ~ N(μ , σ2 ) utilizando el proceso de estandarización Z = (X - μ ) / σ , se puede efectuar el cálculo de probabilidades tales como:  P[a  X  b] = P[ (a - μ ) / σ  (X - μ ) / σ  (b - μ ) / σ ] = P[ (a - μ ) / σ  Z  (b - μ ) / σ ] = Φ [(b - μ ) / σ ] - Φ [(a - μ ) / σ ]  P[X  a] = P[(X - μ ) / σ  (a - μ ) / σ ] = P[Z  (a - μ ) / σ ] = Φ [(a - μ ) / σ ]  P[X > a] = 1 – P[X  a] = 1 - Φ [(a - μ ) / σ ] Los valores de la función de distribución acumulativa normal estándar, Φ (z) o F(z), han sido reproducidos en la Tabla 1 del Anexo utilizando la hoja de cálculo Excel. Uso de la Tabla de la distribución normal estándar a) Para calcular probabilidades.- en la tabla 1, conocido el valor de z, hallar Φ (z) = F(z) = P [Z  z]. Por ejemplo, para z = 1.96, tenemos que: Φ (1.96) = F (1.96) = P [Z  1.96] = 0.97500. b) Para hallar valores de z.- es un proceso inverso al anterior, ya que conocida la probabilidad Φ (z) = F (z) = P [Z  z] = α , en la tabla 1, se debe hallar el valor de z que acumule en probabilidad α y que denotaremos como z = Zα . Para el mismo ejemplo, sí Φ (z) = F (z) = P [Z  z] = 0.97500, esto implica que, en la tabla 1, a la probabilidad 0.97500, le corresponde z = Z0.97500 1.96 . Una característica importante de la distribución normal es que:  Entre μ – σ y μ + σ se encuentra el 68.27% de las observaciones. Es decir que : P(μ – σ  X  μ + σ) =             11 ZP X P       = Φ (1) - Φ (-1) = 0.84134 –0.15866 = 0.68268
  • 9. 9  Entre μ – 2σ y μ + 2σ se encuentra el 95.45% de las observaciones, puesto que: P(μ – 2σ  X  μ + 2σ) =           22 22 ZPZP     = Φ (2) - Φ (-2) = 0.97725 –0.02275 = 0.9545  Entre μ – 3σ y μ + 3σ se encuentra el 99.73% de las observaciones. Es decir que: P(μ – 3σ  X  μ + 3σ) =           33 33 ZPZP     = Φ (3) - Φ (-3) = 0.99865 – 0.00135 = 0.9973  Entre μ – 4σ y μ + 4σ se encuentra el 99.9937% de las observaciones. Es decir que: P(μ – 4σ  X  μ + 4σ) =   4 4 4 4P Z P Z                       = Φ (4) - Φ (-4) = 0.999968 – 0.000031 = 0.999937  Entre μ – 5σ y μ + 5σ se encuentra el 99.999942% de las observaciones. Es decir que: P(μ – 5σ  X  μ + 5σ) =   5 5 5 5P Z P Z                       = Φ (5) - Φ (-5) = 0.99999971 – 0.00000029 = 0.99999942  Entre μ – 6σ y μ + 6σ se encuentra el 99.9999998% de las observaciones. Es decir que: P(μ – 6σ  X  μ + 6σ) =   6 6 6 6P Z P Z                       = Φ (6) - Φ (-6) = 0.999999999 – 0.000000001 = 0.999999998 1.3 PROPIEDAD REPRODUCTIVA DE LA DISTRIBUCIÓN NORMAL Sean X1 , X2 , .... , Xn , n variables aleatorias independientes distribuidas normalmente con media μi y varianza σi 2 . Es decir: Xi ~ N(μi , σi 2 ) i = 1, 2, 3, .... , n . Si Y es una combinación lineal de las v.a. Xi : Y = a0 + a1 X1 + a2 X2 + .... + an Xn . Entonces, la variable aleatoria Y ~ N [a0 + n i iia 1  ,  n i iia 1 22  ]
  • 10. 10 Puesto que:  μY = E(Y) = E (a0 + a1 X1 + a2 X2 + .... + an Xn ) = = E(a0 ) + E (a1 X1 ) + E (a2 X2 ) + .... + E (an Xn ) = = a0 + a1 E(X1 ) + a2 E(X2 ) + .... + an E(Xn ) = = a0 + a1 μ1 + a2 μ2 + .... + an μn = a0 + n i iia 1   2 Y = V(Y) = V (a0 + a1 X1 + a2 X2 + .... + an Xn ) = = V(a0 ) + V(a1 X1 ) + V(a2 X2 ) + .... + V(an Xn ) = = 0 + a1 2 V(X1 ) + a2 2 V(X2 ) + .... + an 2 V(Xn ) = = a1 2 σ1 2 + a2 2 σ2 2 + .... + a2 n σn 2 =  n i iia 1 22  1.4 TEOREMA DEL LÍMITE CENTRAL Sean X1 , X2 , .... , Xn , n variables aleatorias independientes con media y varianza finitas dadas por: E(Xi) = μi y V(Xi ) = σi 2 . Si: Yn = X1 + X2 + .... + Xn =  n i iX 1 , entonces bajo ciertas condiciones generales, la variable aleatoria Zn definida por:           n i i n i n i ii n nn n X YV YEY Z 1 2 1 1 )( )(   tiene aproximadamente una distribución normal estándar N(0, 1). Nota.-  E(Yn ) = E (X1 + X2 + .... + Xn ) = E (X1 ) + E (X2 ) + .... + E (Xn ) =
  • 11. 11 = μ1 + μ2 + .... + μn =  n i i 1  .  V(Yn ) = V (X1 + X2 + .... + Xn ) = V(X1 ) + V(X2 ) + .... + V(Xn ) = = σ1 2 + σ2 2 + .... + σn 2 =  n i i 1 2  . Observaciones.- 1. La variable aleatoria Yn =  n i iX 1 (suma de v.a. independientes) puede ser aproximada por una v.a. distribuida normalmente, cualquiera que sea la distribución de las Xi . 2. Las condiciones generales indicadas en el teorema están referidas a que los términos Xi tomados individualmente, contribuyen con una cantidad despreciable a la variación de la suma, y no es probable que un simple término tenga una gran contribución a la suma. Una aplicación importante de estas condiciones generales del teorema central del límite, se da en los modelos de regresión: Yi = β0 + β1 X1i + β2 X2i + .... + βk Xki + ei Donde la variable explicada o dependiente Y es función de un conjunto de variables explicativas o independientes (X1 , X2 , .... , Xk ) más un error e. La aplicación del teorema central del límite se da cuando se asume que los errores ei se distribuyen normalmente, debido a que estos errores recogen la suma de las contribuciones despreciables de todas las variables dejadas de considerar en el modelo. Por ejemplo, en los modelos de demanda Qi = a – b Pi + ei , se asume que las cantidades demandadas (Q) de un bien o servicio dependen fundamentalmente del precio (P) del bien. Efectivamente, pero existen otras variables independientes (gastos de publicidad, precio del bien sustituto, gustos y preferencias, etc.) que también podrían explicar dicha demanda, sin embargo, sus contribuciones a explicar la demanda son despreciables, por lo que la suma de sus contribuciones, reflejadas en los errores ei se aproximan a la distribución normal.
  • 12. 12 3. Una situación especial del teorema central del límite se presenta cuando cada Xi tiene la misma distribución (que es el caso de la definición de muestra aleatoria, como veremos más adelante) y que permita encontrar la distribución de una media muestral. La propuesta es la siguiente: Sean X1 , X2 , .... , Xn , n variables aleatorias independientes, idénticamente distribuidas con media y varianza común y finitas dadas por: E(Xi) = μ y V(Xi ) = σ2 . Si: Yn = X1 + X2 + .... + Xn =  n i iX 1 , entonces la variable aleatoria Zn dada por : n X n nX YV YEY Z n n i i n nn n /)( )( 1            tiene aproximadamente distribución normal estándar N(0 , 1). Donde   n i in X n X 1 1 es la media muestral de las Xi . Nota.-  E(Yn ) = E (X1 + X2 + .... + Xn ) = E (X1 ) + E (X2 ) + .... + E (Xn ) = = μ + μ + .... + μ = n μ .  V(Yn ) = V (X1 + X2 + .... + Xn ) = V(X1 ) + V(X2 ) + .... + V(Xn ) = = σ2 + σ2 + .... + σ2 = n σ2
  • 13. 13 1.5 EJERCICIOS RESUELTOS 1. Sea Z una variable aleatoria con distribución normal estándar [Z ~ N(0, 1)]. Hallar las probabilidades siguientes: a) P(Z > 1.13) ; b) P(1.00 < Z < 1.42) c) P(-1.5 < Z < 0.50) ; d) P(-1.65 < Z < -1.00) ; e) P(Z < -1.52) ; f) P(0 < Z < 1.25) y g) P(-1.63 < Z < 0). Solución.-Usando la tabla 1 del anexo se tiene: a) P(Z > 1.13) = 1 - P(Z ≤ 1.13) = 1 – Φ(1.13) = 1 – 0.8708 = 0.1292 b) P(1.00 < Z < 1.42) = Φ(1.42) - Φ(1.00) = 0.9222 – 0.8413 = 0.0809 Para obtener los gráficos en Minitab ver Bazán, Juan (2010) 0.4 0.3 0.2 0.1 0.0 Z Densidad 1 0.0809 1.420 En Minitab: P(1.00 < Z < 1.42) 0.4 0.3 0.2 0.1 0.0 Z Densidad -1.5 0.6247 0.50 P(-1.5  Z < 0.5) c) P(-1.5  Z < 0.5) = Φ(0.50) - Φ(-1.5) = 0.6915 – 0.0668 = 0.6247 d) P(-1.65  Z  -1.00) = Φ(-1.00) - Φ(-1.65) = 0.1587 – 0.0495 = 0.1092 e) P(Z < -1.52) = Φ(-1.52) = 1 - Φ(1.52) = 1 – 0.9357 = 0.0643 f) P(0  Z  1.25) = Φ(1.25) - Φ(0) = 0.8944 – 0.5000 = 0.3944 g) P(-1.63 < Z  0) = Φ(0) - Φ(-1.63) = 0.5000 – 0.0516 = 0.4484 2. Sea Z una variable aleatoria normal estándar [Z ~ N(0, 1)]. Hallar el valor de z para los casos siguientes: a) Φ(z) = 0.9500; b) Φ(z) = 0.9772; c) Φ(z) = 0.9987; d) el área entre –z y z es 0.95; e) el área a la izquierda de z es 0.01; y f) el área a la derecha de z es 0.05.
  • 14. 14 Solución a) Sí Φ (z) = F (z) = P [Z  z] = 0.9500, esto implica que, en la tabla 1, a la probabilidad 0.9500, le corresponde z = Z0.9500 = 1.645 aproximadamente. b) Sí Φ (z) = F (z) = P [Z  z] = 0.9772, esto implica que, en la tabla 1, a la probabilidad 0.9772, le corresponde z = Z0.9772 = 2.00 aproximadamente. c) Sí Φ (z) = F (z) = P [Z  z] = 0.9987, esto implica que, en la tabla 1, a la probabilidad 0.9987, le corresponde z = Z0.9987 = 3.00aproximadamente. d) Si 0.95 = P [-z  Z  z] = Φ (z) - Φ (-z) = Φ (z) – [1 - Φ (z)] = 2 Φ (z) – 1. Entonces, Φ (z) = 0.9750 y en la tabla le corresponde a z = Z0.9750 = 1.96. e) Si 0.01 = Φ (z) = P [Z  z], esto implica que, en la tabla 1, a la probabilidad 0.01, le corresponde z = Z0.01 = -2.33 aproximadamente. f) Si 0.05 = P [Z ≥ z] = 1 - Φ (z), entonces Φ (z) = 0.9500 y de acuerdo a lo visto en la parte a) de este problema le corresponde a z = Z0.9500 = 1.645. 3. El monto de las solicitudes de préstamo de los comerciantes que recibe un Banco, está distribuido aproximadamente en forma normal con μ = S/. 10,000 y σ = S/. 1,000. Calcule e interprete la probabilidad de que el monto del préstamo solicitado: a) Esté entre S/. 8,500 y 12,000; b) Sea menor que S/. 8,000; c) Mayores de que cantidad será el 20 % de los préstamos? Solución Sea X = monto de las solicitudes de préstamo. Se sabe que X ~ N(10000 , 10002 ), entonces Z = (X – 10000)/ 1000 ~ N(0, 1). Luego, las probabilidades solicitadas son: a) P(8500 ≤ X ≤ 12000) = 8500 10000 10000 12000 10000 1000 1000 1000 X P         = = P(-1.5 ≤ Z ≤ 2.0) = Φ(2.00) - Φ(-1.50) = 0.97725 – 0.06681 = 0.91044 Rpta. Interpretación: el 91.04% de los montos de préstamo solicitados por los comerciantes fluctúa entre S/. 8,500 y 12,000.
  • 15. 15 b) P(X ≤ 8000) = 10000 8000 10000 1000 1000 X P       = = P(Z ≤ -2.0) = Φ(-2.00) = 0.02275 Rpta. Interpretación: el 2.28% (ó en 228 de cada 10000 solicitudes) de los montos de préstamo solicitados por los comerciantes es menor a S/. 8,000. 0.0004 0.0003 0.0002 0.0001 0.0000 X = monto del préstamo Densidad 8000 0.0228 10000 Normal, Media=10000, Desv.Est.=1000 Distribución del monto de préstamo Resultado gráfico en Minitab c) Sea C la cantidad de préstamo buscada, entonces: 0.20 = P(X > C) = 1 - 10000 1000 C P Z       0.80 = 10000 1000 C         0 . 8 0 10000 0.84 1000 C Z     C = S/. 10840 Rpta. Interpretación: el 20% de los montos de préstamo solicitados por los comerciantes es mayor a S/. 10,840.
  • 16. 16 0.0004 0.0003 0.0002 0.0001 0.0000 X = monto del préstamo Densidad 10840 0.20 10000 Normal, Media=10000, Desv.Est.=1000 Distribución del monto de préstamo 4. Para cierto examen la calificación vigesimal tiene distribución normal con media 11 y desviación estándar 2. Se desea desaprobar al 40% de los examinados. ¿Cuál debe ser la calificación máxima desaprobatoria? Interprete el resultado. Solución Sea X = calificación vigesimal de los examinados. Se sabe que X ~ N(11 , 22 ), entonces Z = (X – 11)/ 2 ~ N(0, 1). Sea M la máxima nota desaprobatoria buscada, entonces: 0.40 = P(X < M) = 11 2 M P Z       = 11 2 M         0.40 11 0.25 2 M Z      M = 10.5 Rpta. Interpretación: el 40% de los examinados desaprobados tiene nota menor a 10.5. 5. Los ingresos de los trabajadores tiene distribución normal con media µ= S/. 1000 y desviación estándar σ = S/. 200. Si se selecciona a 2000 de estos trabajadores, calcule e interprete: a) ¿Cuántos trabajadores tienen ingreso menor a S/. 600? b) ¿Cuántos trabajadores tienen ingreso entre S/. 850 y 1300? Solución
  • 17. 17 Si X = ingreso de los trabajadores ~ N(1000, 2002 ), Z = (X – 1000)/ 200 ~ N(0, 1). Para determinar cuántos de los n = 2000 trabajadores tienen ingresos en los intervalos dados, primero se determina la probabilidad P y después multiplica por n. Se pide: a) P = P(X < 600) = 1000 600 1000 200 200 X P        = P(Z < -2.0) = Φ(-2.0) = 0.02275 Luego nP = 0.02275 x 2000 = 45.5 trabajadores Rpta. Interpretación: 46 trabajadores (2.28%) tienen ingreso menor a S/. 600. b) P = P(850 ≤ X ≤ 1300) = 850 1000 1000 1300 1000 200 200 200 X P         = = P(-0.75 ≤ Z ≤ 1.5) = Φ(1.5) - Φ(-0.75) = 0.93319 – 0.22663 = 0.70656 0.0020 0.0015 0.0010 0.0005 0.0000 X = ingreso Densidad 850 0.7066 13001000 Normal, Media=1000, Desv.Est.=200 Distribución del ingreso Luego nP = 0.70656 x 2000 = 1413.12 trabajadores Rpta. Interpretación: alrededor de 1413 trabajadores (70.66%) tienen ingreso entre S/. 850 y 1300. 6. El volumen de negociaciones diarias (en millones de nuevos soles) para las acciones comercializadas en la bolsa de Lima tiene distribución normal con media µ= 800 y desviación estándar σ = 100. En un período de 60 días, calcule e interprete: a) ¿En cuántos días el volumen de negociaciones es de 600 o menos millones? b) ¿En cuántos días el volumen de negociaciones es mayor de 900 millones?
  • 18. 18 Solución Si X = volumen diario de negociaciones en millones de S/. ~ N(800, 1002 )  Z = (X – 800)/ 100 ~ N(0, 1). Para determinar en cuántos de los n = 60 días el volumen de las negociaciones está en los intervalos dados, primero se determina la probabilidad P y después multiplica por n. Se pide: a) P = P(X ≤ 600) = 800 600 800 100 100 X P        = P(Z < -2.0) = Φ(-2.0) = 0.02275 Luego nP = 0.02275 x 60 = 1.4 días Rpta. Interpretación: en alrededor de 1.4 días (2.28%) el volumen de negociaciones es de 600 o menos millones de nuevos soles. b) P = P(X > 900) = 800 900 800 100 100 X P        = P(Z > 1.0) = 1 - Φ(1.0) = = 1 – 0.84134 = 0.15866. Luego nP = 0.15866 x 60 = 9.5días Rpta. Interpretación: en alrededor de 9.5 días (15.87%) el volumen de negociaciones es mayor de 900 millones de nuevos soles. 7. El peso de los pernos fabricados se distribuye normalmente con media µ= 80 gr. y desviación estándar σ = 5 gr. Si se almacenan 2000 pernos, calcule e interprete ¿qué cantidad de pernos pesan: a) menos de 70 gramos? y b) entre 75 y 90 gramos? Solución Si X = peso de los pernos ~ N(80, 52 )  Z = (X – 80)/ 5 ~ N(0, 1). Para determinar cuántos de los n = 2000 pernos tienen un peso en los intervalos dados, primero se determina la probabilidad P y después multiplica por n. Se pide: a) P = P(X < 70) = 80 70 80 5 5 X P        = P(Z < -2.0) = Φ(-2.0) = 0.02275 Luego nP = 0.02275 x 2000 = 46 pernos Rpta. Interpretación: alrededor de 46 pernos (2.28%) pesan menos de 70 gramos. b) P = P(75 ≤ X ≤ 90) = 75 80 80 90 80 5 5 5 X P         = P(-1 ≤ Z ≤ 2) =
  • 19. 19 = Φ(2.0) - Φ(-1.0) = 0.97725 – 0.15866 = 0.81859. 0.09 0.08 0.07 0.06 0.05 0.04 0.03 0.02 0.01 0.00 X = peso Densidad 75 0.8186 9080 Normal, Media=80, Desv.Est.=5 Distribución del peso de los pernos Resultado gráfico en Minitab Luego nP = 0.81859 x 2000 = 1637 pernos Rpta. Interpretación: alrededor de 1637 pernos (81.86%) pesan entre 75 y 90 gramos. 8. El tiempo necesario para terminar un examen se distribuye normalmente con media µ= 80 minutos y desviación estándar σ = 10 minutos. En un curso de 60 alumnos, calcule e interprete cuántos alumnos terminan el examen: a) ¿en una hora o menos? b) ¿en más de 60 minutos, pero en menos de 75 minutos? c) ¿Cuántos alumnos no terminan el examen, si éste dura 90 minutos? Solución Si X = tiempo para terminar un examen ~ N(80, 102 )  Z = (X – 80)/ 10 ~ N(0, 1). Para determinar cuántos de los n = 60 alumnos terminan el examen en los intervalos dados, primero se determina la probabilidad P y después multiplica por n. Se pide: a) P = P(X ≤ 60) = 80 60 80 10 10 X P        = P(Z ≤ -2.0) = Φ(-2.0) = 0.02275. Luego nP = 0.02275 x 60 = 1.4 alumnos Rpta.
  • 20. 20 Interpretación: alrededor de 1.4 alumnos (2.28%) terminan el examen en una hora o menos. b) P = P(60 ≤ X ≤ 75) = 60 80 80 75 80 10 10 10 X P         = P(-2 ≤ Z ≤ -0.5) = = Φ(-0.50) - Φ(-2.0) = 0.30854 – 0.02275 = 0.28579. Resultado gráfico en Minitab 0.04 0.03 0.02 0.01 0.00 X = tiempo duración examen Densidad 60 0.286 75 80 Normal, Media=80, Desv.Est.=10 Distribución tiempo duración examen Luego nP = 0.28579 x 60 = 17 alumnos Rpta. Interpretación: alrededor de 17 alumnos (28.6%) terminan el examen en más de 60 minutos, pero en menos de 75 minutos. c) P = P(X > 90) = 80 90 80 10 10 X P        = P(Z > 1.0) = 1 - Φ(1.0) = = 1 – 0.84134 = 0.15866. Luego nP = 0.15866 x 60 = 9.5 alumnos Rpta. Interpretación: alrededor de 10 alumnos (15.87%) no terminan el examen, si éste dura 90 minutos. 9. Suponga que el ingreso familiar mensual (X) en una comunidad tiene distribución normal con media $400 y desviación estándar $50. Si los gastos de consumo familiar (C) están dados por la relación C = 0.80 X + 50, ¿calcule e interprete la probabilidad de que los gastos de consumo familiar sean inferiores a $320? Solución
  • 21. 21 Si X = ingreso familiar mensual ~ N(400, 502 ),  Z = (X – 400)/ 50 ~ N(0, 1). Se pide: P(C < 320) = P(0.80 X + 50 < 320) = P(X < 337.5) = = 400 337.5 400 50 50 X P        = P(Z < -1.25) = Φ(-1.25) = 0.10565 Rpta. Otra forma de resolver es usando la propiedad reproductiva de la distribución normal. Sí C = 0.80 X + 50, entonces la media y la varianza de C son:  ( ) 0.8 ( ) 50 0.8(400) 50 370C E C E X         22 2 (0.8 50) 0.8 ( ) 0.64(2500) 1600 40C Var X Var X       Luego C ~ N(370, 402 ),  Z = (C – 370)/ 40 ~ N(0, 1). Entonces: P(C < 320) = 370 320 370 40 40 C P        = P(Z < -1.25) = Φ(-1.25) = 0.10565 Rpta. Interpretación: el 10.6% de (ó en 1057 de cada 10000 familias) los gastos de consumo familiar en la comunidad son menores a S/. 320. 10. Sean Xl , X2 y X3 variables a1eatorias independientes tales que: X1 ~ N (10 , 3 ) ; X2 ~ N (12 , 4 ) y X3 ~ N (14 , 6). Si Y = X1 - 2 X2 + X3 . Se pide: a) Hallar la media y la varianza de Y ; b) Ca1cule e interprete  8 10P Y   Solución X1 ~ N (10 , 3 ) 1 10  ; 32 1  X2 ~ N (12 , 4 ) 2 12  ; 42 2  X3 ~ N (14 , 6 ) 3 14  ; 2 3 6  a) Cálculo de la media y la varianza de Y     1 2 3 1 2 32 ( ) 2 ( ) ( )Y E Y E X X X E X E X E X        = 1 2 32 10 2(12) 14 0Y          Rpta.  2 1 2 3 1 2 3( ) ( 2 ) ( ) 4 ( ) ( )Y V Y V X X X V X V X V X        2 2 2 2 1 2 34 3 4(4) 6 25Y          Rpta.
  • 22. 22 b) Cálculo de la  8 10P Y   Sabemos que 0Y  y 252 Y  5Y . Además Y ~ N [0, 25]  Z = (Y – 0)/ 5 ~ N(0, 1). Luego:     8 0 0 10 0 8 10 1.6 2 5 5 5 Y P Y P P Z                   = Φ(2.0) - Φ(-1.60) = 0.97725 – 0.05480 = 0.92245 Rpta. Interpretación: alrededor del 92.25% de los valores observados de Y se encuentran entre -8 y 10. 11. Sean X1, X2, X3 y X4 variables aleatorias normales independientes con μ1 30; μ2 = 25 ; μ3 = 12 ; μ4 = 8 ; 2 1 = 8 ; 2 2 = 6 ; 2 3 = 6 ; 2 4 = 2. Sí: Y =        4 2 21 XX - 3 4 2 X X     Calcule e interprete: a)  8 14P Y  y b) P 12Y    Solución: Y =        4 2 21 XX - 3 4 2 X X     = 31 2 4 4 2 2 2 XX X X     μY = E(Y) =        1 2 3 4 1 1 1 1 4 2 2 2 E X E X E X E X   = 1 1 1 1 (30) (25) (12) (8) 10 4 2 2 2      2 Y = V (y) = 1 2 3 4 1 1 1 1 ( ) ( ) ( ) ( ) 16 4 4 4 V X V X V X V X   = 1 1 1 1 (8) (6) (6) (2) 4 16 4 4 4     Siendo Y una combinación lineal de las variables independientes Xi cada una con distribución normal, entonces por la propiedad reproductiva de la distribución normal se cumple que Y ~ N [10, 4]  Z = (Y – 10)/ 2 ~ N(0, 1). Luego: a)  8 14P Y  = 8 10 10 14 10 2 2 2 Y P         = P (-1.0 ≤ Z ≤ 2.0) = = Φ(2.0) - Φ(-1.0) = 0.97725 – 0.15866 = 0.81859 Rpta.
  • 23. 23 Interpretación: el 81.86% de los valores de Y se encuentran entre 8 y 14. b) P 12Y    =  12 12P Y   = 12 10 10 12 10 2 2 2 Y P          = = P (-11.0 ≤ Z ≤ 2.0) = Φ(2.0) - Φ(-11.0) = = 0.97725 – 0.00000 = 0.0.97725 Rpta. Interpretación: alrededor del 97.73% de los valores absolutos de Y son menores o iguales a 12. 12. En el proceso de fabricación de condensadores, varias pruebas han demostrado que la temperatura más alta (en °C) que pueden soportar es N(125, 9). En los sistemas en que se utilizan, la temperatura máxima (en °C) a que se sujeta un condensador individual es N(116, 16). ¿Qué proporción de condensadores fallará por sobre calentamiento? Interprete el resultado. Solución Sean: F = temperatura más alta de fabricación ~ N(125, 9) y U = temperatura máxima de uso ~ N(116, 16) Habrá falla por sobrecalentamiento (S) cuando S = F < U = F – U < 0. Para hallar la proporción solicitada mediante P(S) = P(F < U) = P(F – U < 0) determinamos la distribución de F – U usando la propiedad reproductiva de la distribución normal, así: F – U ~ N(9, 25)  Z = ( F – U – 9)/ 5 ~ N(0, 1). Entonces: P(S) = P(F < U) = P(F – U < 0) = 80 0 9 5 5 F U P         = = P(Z ≤ -1.8) = Φ(-1.8) = 0.03593 Rpta. Interpretación: alrededor del 3.59% de los (ó 359 de cada 10000) condensadores fabricados falla por sobrecalentamiento en los sistemas en que se utilizan. 13. En una de las etapas de un proceso de ensamble un tapón cilíndrico tiene que ajustarse a una abertura circular seleccionando cada elemento al azar en un suministro continuo. Los diámetros del tapón y de los casquillos en mm, son N(24.9, 0.032 ) y N(25, 0.042 ) respectivamente. Si para que el ajuste sea
  • 24. 24 satisfactorio se requiere un claro de diámetro de cuando menos 0.02 mm, ¿en qué proporción de los casos el ajuste no será satisfactorio? Interprete el resultado. (claro del diámetro = diámetro del casquillo – diámetro del tapón) Solución Sean: T = diámetro del tapón ~ N(24.9, 0.032 ) y C = diámetro del casquillo ~ N(25, 0.042 ) Si X = claro del diámetro = C – T, usando la propiedad reproductiva de la distribución normal se tiene que: µX = E(X) = E(C – T) = E(C) – E(T) = 25.0 – 24.9 = 0.10 σ2 X = V(X) = V(C – T) = V(C) + V(T) = 0.0009 +0.0016 = 0.0025 = 0.052 . Luego: X = claro del diámetro = C – T ~ N(0.10, 0.052 )  Z = (X – 0.10)/ 0.05 ~ N(0, 1). Que el ajuste no sea satisfactorio implica que X < 0.02. Entonces: P(X < 0.02) = 0.10 0.02 0.10 0.05 0.05 X P        = P(Z ≤ -1.8) = Φ(-1.6) = 0.0548 Rpta. Interpretación: en alrededor del 5.48% de los (ó en 548 de cada 10000) ensambles el tapón no se ajusta al casquillo. 14. Las pastillas metálicas cilíndricas que se utilizan en un reactor se fabrican en serie y puede suponerse que sus longitudes siguen una distribución normal con media 0.290 cm. y desviación estándar 0.016cm. Nueve de estas pastillas deben ajustarse, extremo con extremo, en un recipiente que ocupa una longitud no mayor de 2.670 cm. Si las nueve pastillas se ensamblan al azar, ¿qué proporción de estos no se ajustará en el espacio requerido? Interprete el resultado. Solución Sean: Xi = diámetro de las pastillas ~ N(0.29, 0.0162 ) y L = longitud del recipiente con 9 pastillas = 9 1 i i X   . Por la propiedad reproductiva de la distribución normal, se tiene que: E(L) = E( 9 1 i i X   ) = 9 1 ( )i i E X   = 9 1 0.29 i  = 9 x 0.29 = 2.61 cm.
  • 25. 25 V(L) = V( 9 1 i i X   ) = 9 1 ( )i i V X   = 9 2 1 0.016 i  = 9 x 0.0162 = 0.002304 cm2 . Luego: L = longitud del recipiente con 9 pastillas = 9 1 i i X   ~ N(2.61, 0.0002304)  Z = (L – 2.61)/ 0.048 ~ N(0, 1). Las 9 pastillas no se ajustan al espacio requerido si L > 2.67. Por lo tanto: P(L > 2.67) = 1 – P(L ≤ 2.67) = 1 - 2.61 2.67 2.61 0.048 0.048 L P        = = 1 - P(Z ≤ 1.25) = 1 - Φ(1.25) = 1 - 0.89435 = 0.10565 Rpta. Interpretación: en alrededor del 10.56% de los (ó en 1056 de cada 10000) recipientes con 9 pastillas, éstas no se ajustan en el espacio requerido. 15. Suponga que las variables aleatorias X1 , X2 , .... , X50 representan la vida útil de 50 tubos electrónicos; los mismos que se usan de la siguiente manera: tan pronto como falla el primer tubo, empieza a funcionar el segundo y cuando falla el segundo empieza a funcionar el tercero, etc. Suponga que los Xi, i = 1, 2, …., 50 tienen distribución exponencial con parámetro λ = 1/500. ¿Cuál es la probabilidad que el tiempo de funcionamiento de los 50 tubos esté comprendido entre 20 000 y 30 000 horas? Interprete el resultado. Solución Sea Xi = tiempo de funcionamiento del tubo i ~ Exponencial (λ = 1/500) Entonces µ = E(Xi) = 1/ λ = 500 , σ2 = 1/ λ2 = 5002 ] i = 1, 2, …., 50. Sea Y50 = tiempo de funcionamiento de los 50 tubos = = 50 1 2 50 1 ............ i i X X X X       Entonces, por el teorema del límite central la probabilidad solicitada es: P(20 000 ≤ Y50 ≤ 30 000) = = 50 1 50 500 20000 50 500 30000 50 500 500 50) 500 50) 500 50) i i X x x x P x x x                 = P(-1.41 ≤ Z ≤ 1.41)
  • 26. 26 = Φ(1.41) - Φ(-1.41) = 0.92073 – 0.07927 = 0.84146 Rpta. Interpretación: en alrededor del 84.15% de los (ó en 8415 de cada 10000) tiempos de funcionamiento de 50 tubos estará comprendido entre 20 000 y 30 000 horas. 16. Las botellas de aceite vegetal “Primor” tienen un contenido medio de 1 litro y una desviación estándar de 0.04. Para la distribución se acomodan en cajas de 36 botellas, Calcule e interprete la probabilidad que una caja contenga más de 36.6 litros. Solución Sea Xi = contenido de las botellas de aceite ~ [µ = 1, σ = 0.04 lts.] Sea Y36 = contenido por caja de las 36 botellas = = 36 1 2 36 1 ............ i i X X X X       Entonces, por el teorema del límite central la probabilidad solicitada es: P(Y36 > 36.6) = 1 - P(Y36 ≤ 36.6) = 1 - 36 1 36 1 36.6 36 1 0.04 36 0.04 36 i i X x x P               = = 1 – P(Z ≤ 2.5) = 1- Φ(2.5) = 1 – 0.99379 = 0.00621 Rpta. Interpretación: alrededor del 0.62% de las (ó en 62 de cada 10000) cajas con 36 botellas de aceite el contenido es de más de 36.6 litros. 17. En una ciudad grande el 20% de los hogares no tiene desagüe. Si se eligen 100 hogares al azar, calcule e interprete la probabilidad de que más de 30 hogares no tengan desagüe. Solución Sea Xi = 1, si el hogar no tiene desagüe ~ Bernoulli [p = 0.20] Sea Y100 = el total de hogares sin desagüe, entre los 100 elegidos = = 100 1 2 100 1 ............ i i X X X X       ~ B[n = 100, p = 0.20] ó N[np = 20, npq = 16] Entonces, por el teorema del límite central la probabilidad solicitada es:
  • 27. 27 P(Y100 > 30) = 1 - P(Y100 ≤ 30) = 1 - 100 1 100 0.20 30 100 0.20 0.20 0.80 100 0.20 0.80 100 i i X x x P x x               = = 1 – P(Z ≤ 2.5) = 1- Φ(2.5) = 1 – 0.99379 = 0.00621 Rpta. Interpretación: en alrededor del 0.62% de los (ó en 62 de cada 10000) grupos de 100 hogares escogidos, más de 30 hogares no tienen desagüe. 18. Un lote de 10 000 pavos tiene un peso medio de 7 Kg. y una desviación estándar de 0.15 Kg. Este lote debe ser entregado a los vendedores minoristas a razón de 100 cada uno. ¿Cuál es la probabilidad de que un vendedor cualquiera de estos tomados al azar, reciba un peso total de menos de 697 kilos? Interprete su resultado. Solución Sea Xi = peso de los pavos ~ [µ = 7, σ = 0.15 Kg.] Sea Y100 = peso total de los 100 pavos = 100 1 2 100 1 ............ i i X X X X       Entonces, por el teorema del límite central la probabilidad solicitada es: P(Y100 < 697) = 100 1 100 7 697 100 7 0.15 100 0.15 100 i i X x x P               = = P(Z < -2.0) = Φ(-2.0) = 0.02275 Rpta. Interpretación: alrededor del 2.28% de los (ó 228 de cada 10000) vendedores minoristas recibe un peso total menor a 697 Kg. 19. La Constructora “Techito” estima que el peso promedio de las personas que vivirán en un edificio de apartamentos es de 68 Kg., con una desviación estándar de 15 Kg. De acuerdo con la estimación, instala en el edificio un ascensor para 36 personas con capacidad máxima de 2700 Kg. Si la estimación es correcta, calcule e interprete la probabilidad de que un cupo completo exceda la capacidad del ascensor. Solución
  • 28. 28 Sea Xi = peso de las personas ~ [µ = 68, σ = 15 Kg.] Sea Y36 = peso total de las 36 personas = 36 1 2 36 1 ............ i i X X X X       Entonces, por el teorema del límite central la probabilidad solicitada es: P(Y36 > 2700) = 1 - P(Y36 ≤ 2700) = 1 - 36 1 36 68 2700 36 68 15 36 15 36 i i X x x P               = = 1 – P(Z ≤ 2.8) = 1- Φ(2.8) = 1 – 0.99744 = 0.00256 Rpta. Interpretación: alrededor del 0.26% de los (ó en 256 de cada 10000) cupos completos del ascensor con 36 personas exceden su capacidad máxima de 2700 Kg. 20. Las botellas de ron “Pepito” tienen un contenido medio de 2 litros y una desviación estándar de 0.018. Para la distribución se acomodan en cajas de 36 botellas, Calcule e interprete la probabilidad que una caja contenga más de 72.36 litros. Solución Sea Xi = contenido de las botellas de ron ~ [µ = 2, σ = 0.018 lts.] Sea Y36 = contenido por caja de las 36 botellas = 36 1 2 36 1 ............ i i X X X X       Entonces, por el teorema del límite central la probabilidad solicitada es: P(Y36 > 72.36) = 1 - P(Y36 ≤ 72.36) = 1 - 36 1 36 2 72.36 36 2 0.018 36 0.018 36 i i X x x P               = = 1 – P(Z ≤ 3.33) = 1- Φ(3.33) = 1 – 0.99957 = 0.00043 Rpta. Interpretación: alrededor del 0.04% de las (ó en 4 de cada 10000) cajas con 36 botellas de ron contienen más de 72.36 litros.
  • 29. 29 EJERCICIOS PROPUESTOS 1. Sea Z una variable aleatoria con distribución normal estándar [Z ~ N(0, 1)]. Hallar las probabilidades siguientes: a) P(Z ≤ 2.15) b) P(0.80 < Z < 1.96) c) P(-2.45 < Z ≤ 1.65) d) P(-2.75 ≤ Z ≤ -0.65) e) P(Z ≥ -1.38) f) P(-2.57 ≤ Z < 0) g) P(0 ≤ Z < 2.33). 2. Sea Z una variable aleatoria normal estándar [Z ~ N(0, 1)]. Hallar el valor de z para los casos siguientes: a) Φ(z) = 0.8665 b) Φ(z) = 0.9222 c) Φ(z) = 0.9972 d) el área entre –z y z es 0.99 e) el área a la izquierda de z es 0.05 f) el área a la derecha de z es 0.025 3. El contenido en las botellas de cierta gaseosa tiene distribución normal con media µ= 1000 ml. y desviación estándar σ = 5 ml. Calcule e interprete la probabilidad de que una botella de gaseosa tenga: a) Entre 990 y 1005 ml. b) Menos de 985 ml. 4. El precio que pagan los hogares por el kilo de pescado en una gran ciudad tiene distribución normal con media µ= S/. 12 y desviación estándar σ = S/. 0.80. Calcule e interprete la probabilidad de que el precio pagado por el kilo de pescado: a) Sea menor de S/. 10. b) Se encuentre entre S/. 10.50 y 13.50. c) Por arriba de que precio paga el 10% superior de los consumidores.
  • 30. 30 5. El tiempo que dura la atención a los clientes de un negocio se distribuye normalmente con media µ= 30 minutos y desviación estándar σ = 4 minutos. Calcule e interprete la probabilidad de que el tiempo de atención a los clientes: a) dure entre 25 y 40 minutos. b) Entre que límites simétricos alrededor de µ dura el 95% de las atenciones. 6. El peso de las cajas de mango se distribuye normalmente con media µ= 20 Kg. y desviación estándar σ = 0.5 Kg. Si se almacenan 2000 cajas, calcule e interprete ¿qué cantidad de cajas pesan: a) menos de 19 kilos? b) entre 19.5 y 21 kilos? 7. El peso de los huevos de gallina producidos por una avícola se distribuye normalmente con media µ= 65 gr. y desviación estándar σ = 5 gr. Si se almacenan 2000 huevos, calcule e interprete ¿qué cantidad de huevos pesan: a) Menos de 70 gramos? b) Entre 55 y 60 gramos? 8. La duración de ciertos focos eléctricos tiene distribución normal con media µ= 1000 horas y desviación estándar σ = 200 horas. Si compra 2000 de estos focos, calcule e interprete: a) ¿Cuántos focos durarán menos de 600 horas? b) ¿Cuántos focos durarán entre 850 y 1300 horas? 9. El volumen de ventas diarias de bolsas de azúcar de la comercializadora “Yapatera” tiene distribución normal con media µ= 800 bolsas y desviación estándar σ = 100. En un período de 60 días, calcule e interprete: a) ¿En cuántos días el volumen de ventas es de 600 o menos bolsas de azúcar? b) ¿En cuántos días el volumen de ventas es mayor de 900 bolsas de azúcar? 10. Sean X1 y X2 variables aleatorias independientes distribuidas normalmente con μ1 50; μ2 = 35; 2 1 = 10; 2 2 = 6. Si: Y = X1 - X2. Calcule e interprete: a) La media y la varianza de Y b)  10 25P Y 
  • 31. 31 11. Sean X1, X2 y X3 variables aleatorias independientes distribuidas normalmente con μ1 10; μ2 = 15; μ3 = 12; 2 1 = 3; 2 2 = 4; 2 3 = 6. Sí: Y = X1 + 2 X2 - X3 Calcule e interprete: a)  20 40P Y  b) P 18Y  12. Los teléfonos celulares A y B tienen una duración (en días) que son N(2190, 2002 ) y N(2878, 2502 ) respectivamente. Si se prueba la vida de cada uno de los teléfonos correspondientes a cada una de las marcas, ¿cuál es la probabilidad que los A duren un año o más que los B? Interprete su resultado. 13. En una ciudad grande el 20% de hogares no tiene agua. Si se escogen 100 hogares, calcule e interprete la probabilidad que más de 30 no tengan agua. 14. Al lanzar una moneda 100 veces, calcule e interprete la probabilidad de obtener entre 40 y 60 caras. 15. Las cajas con limón tienen un peso medio de 20 Kg. y una desviación estándar de 750 gr. Calcule e interprete la probabilidad de que el peso de 410 cajas recibidas al azar y cargadas en un camión, supere su capacidad máxima que es de 8,250 kg. 16. Los pesos de los sacos de algodón Pima cosechados tienen una media de 50 kilos y una desviación estándar de 1.4 kilos. Calcule e interprete la probabilidad de que el peso de 100 paquetes seleccionados al azar sea menor de 4975 kilos. 17. Las cajas con naranja tienen un peso medio de 15 Kg. y una desviación estándar de 0.5 kilos. Calcule e interprete la probabilidad de que el peso de 400 cajas tomadas al azar sea menor de 5,980 kg. 18. Un lote de 10 000 pollos para parrilla tiene un peso medio de 1 Kg. y una desviación estándar de 0.05 Kg. Este lote debe ser entregado a las pollerías a razón de 100 cada una. ¿Cuál es la probabilidad de que una pollería, cualquiera
  • 32. 32 de estas tomada al azar, reciba un peso total de menos de 98.5 kilos? Interprete su resultado. 19. Los pesos de los paquetes recibidos en las tiendas Ripley tienen una media de 580 libras y una desviación estándar de 80 libras. Calcule e interprete la probabilidad de que el peso de 49 paquetes recibidos al azar y cargados en un montacargas, supere su capacidad de 30 000 libras. 20. Un lote muy grande de cajas con palta tiene un peso medio μ = 20 Kg. y una desviación estándar σ = 0.5 Kg. Este lote debe ser entregado a los supermercados a razón de 100 cajas cada uno. Calcule e interprete ¿la probabilidad de que un supermercado cualquiera, reciba un peso total de menos de 1 990.2 Kg.?
  • 33. 33 Capítulo 2. DISTRIBUCIONES MUESTRALES “¿Hace falta remarcar que un país que no conoce su demografía, tampoco conoce su economía? No se puede saber lo que un país produce y ahorra si se ignora esta cosa fundamental: la población. .... En un país donde no se puede contar a los hombres, menos aún se puede contar la producción. Se desconoce el primero de sus factores: el factor humano, el factor trabajo..” José Carlos Mariátegui CONTENIDO 2.1 Distribuciones muestral de la media. 2.2 Distribución muestral del total (conocida la media) 2.3 Distribución de la diferencia de medias muestrales. 2.4 Distribución muestral de la proporción. 2.5 Distribución muestral del total (conocida la proporción) 2.6 Distribución muestral de la diferencia de proporciones. 2.7 Ejercicios resueltos. 2.8 Ejercicios propuestos. La estadística es una ciencia importante porque permite el conocimiento de la población basándose en muestras aleatorias representativas. El principal problema de la estadística es estudiar una población con función de cuantía o función de densidad, f(x, θ) conocida o supuestamente conocida, con parámetro θ desconocido. Si se conoce θ, la distribución de probabilidad queda determinada. Para ello, se toma una muestra aleatoria de tamaño n (X1 , X2 , .... , Xn ) de una población de tamaño N y se busca alguna función de esta muestra que estime el parámetro desconocido θ, problema que será abordado con mayor detalle en el capítulo de estimación. En este capítulo se desarrollan las distribuciones muestrales para muestras grandes (n ≥ 30 ) referidas a la media, a la diferencia de medias, a la proporción, a la diferencia de proporciones y a los totales (conocida la distribución de la media y la proporción). Cabe resaltar que el conocimiento de estas distribuciones muestrales es el soporte fundamental para poder comprender el desarrollo de la estimación por intervalos y la docimasia de hipótesis a tratar capítulos más adelante. A continuación se desarrolla cada uno de los conceptos importantes de las distribuciones muestrales.
  • 34. 34 Población.- es el conjunto de todas las unidades de análisis (individuos u objetos) a ser observadas y que poseen una característica común. Es decir, es el conjunto de todas las observaciones posibles que puede tomar una variable aleatoria X. Por ejemplo, en todas las empresas podemos estudiar: el número de trabajadores, las ventas, etc.; en todos los hogares podemos estudiar: los ingresos, los gastos, etc. Muestra.- es una parte representativa de la población. La representatividad implica adecuado: método de muestreo, tamaño de muestra, selección de la muestra y propuesta de estimadores (fórmulas). Relacionado al ejemplo anterior, la muestra vendría dada por una parte representativa de empresas u hogares. Muestra Aleatoria.- Sea X una variable aleatoria con distribución de probabilidad f(x) (función de cuantía o función de densidad) con media μ y varianza σ2 . Una muestra aleatoria (m.a.) de tamaño n de X, es un conjunto de n variables aleatorias (X1 , X2 , .... , Xn ) que cumplen: 1. Cada Xi (i = 1, 2, .... , n) tiene la misma distribución que X. Es decir, tienen la misma distribución de probabilidades )()( xfxf XXi  , la misma función de distribución acumulativa )()( xFxF XXi  , la misma media iX = E(Xi) = E(X) = μ con N X N i i  1  y la misma varianza 2 IX = V(Xi ) = V(X) = N X N i i   1 2 2 )(   . 2. Las variables aleatorias Xi (i = 1, 2, .... , n) son independientes. Por lo tanto la función de probabilidad conjunta de la muestra aleatoria X1 , X2 , .... , Xn está dada por:   n i iXnXXXnXXX XfXfXfXfXXXf n 1 2121,....,, )()()....()(),....,,(21 . Esta probabilidad de ocurrencia de la muestra observada, es importante en estimación puntual, ya que allí representa la función de verosimilitud a maximizar. Nota:
  • 35. 35  La definición de m.a. se cumple cuando la muestra proviene de una población infinita (discreta o continua) y cuando la muestra se extrae con reemplazo de una población finita.  La definición de m.a. no se cumple cuando el muestreo es sin reemplazo de una población finita, ya que las v.a. X1 , X2 , .... , Xn no son independientes. Sin embargo, si el tamaño n de la muestra es muy pequeño en comparación con el tamaño N de la población (n < 5% N ) se cumple aproximadamente la definición. Ejemplo 1.- Si se toma una m.a. de tamaño n, de una población X con distribución de Poisson, con parámetro λ, hallar la función de probabilidad conjunta (función de verosimilitud) para dicha muestra. Solución: Como la v.a. X ~ Poisson (λ), entonces Xi ~ Poisson (λ) y su función de probabilidad es: ni X e Xf i X iX i ,....,2,1, ! )(    ; Xi = 0, 1, 2, 3, ...... Luego la función de probabilidad conjunta (función de verosimilitud) será: )()....()(),....,,( 2121,....,, 21 nXXXnXXX XfXfXfXXXf n  =  n i i X X ei 1 !   =        !1 1 X eX          !2 2 X eX    ....        !n X X en   = =    n i i n X X e n i i 1 ! 1   , Xi = 0, 1, 2, 3, ...... ;  i = 1, 2, .... , n . Rpta. Ejemplo 2.- Si se toma una m.a. de tamaño n, de una población X con distribución N(μ , σ2 ), hallar la función de probabilidad conjunta (función de verosimilitud) para dicha muestra. Solución:
  • 36. 36 Como la v.a. X ~ N(μ , σ2 ), entonces Xi ~ N(μ , σ2 ) y su función de probabilidad está dada por:   ,; 2 1 )( 22 2/)( 2 i X iX XeXf i   i = 1, 2, 3, .... , n. Luego la función de densidad conjunta (función de verosimilitud) será: )()....()(),....,,( 2121,....,, 21 nXXXnXXX XfXfXfXXXf n  = =        22 1 2/)( 2 2 1   X e        22 2 2/)( 2 2 1   X e  ....        22 2/)( 2 2 1   nX e = =         ,; 2 1 1 22 2/)(2 2 i X n xe n i i   i = 1, 2, 3, .... , n. Rpta. Estadístico.- es una variable aleatoria que depende sólo de la muestra observada. Así, si X1 , X2 , .... , Xn es una m.a. de una población X, entonces la media muestral ( X ) y la varianza muestral (s2 ) son estadísticos. Donde: n X X n i i  1 y 1 )( 1 2 2     n XX s n i i Distribución muestral.- es la distribución de probabilidad de un estadístico. Error estándar de un estadístico.- es la desviación estándar de la distribución muestral de un estadístico. Error relativo de un estadístico.- es el coeficiente de variación de la distribución muestral de un estadístico. Teorema 1.- Sea X1 , X2 , .... , Xn una muestra aleatoria de tamaño n de una población X, con media E(X) = μ y varianza Var (X) = σ2 . Sea n X X n i i  1 la media muestral, entonces: )(XE y n XVarX 2 2 )(    . Teorema 2.- Sea X1 , X2 , .... , Xn una muestra aleatoria sin reemplazo de tamaño n de una población X de tamaño N, con media E(X) = E(Xi ) = μ y varianza Var (X) = Var (Xi) = σ2 . Entonces: )(XE y                 N nN n S N nN n XVarX 22 2 1 )(   .
  • 37. 37 Donde: 1 )( 1 2 2     N X S N i i  , representa la cuasivarianza poblacional y el factor 1  N nN se llama factor de corrección para poblaciones finitas (f.c.p.f.) el mismo que es descartado cuando la fracción de muestreo (f ) 1 1 97.005.0     N nN N n f . A continuación presentamos las distribuciones muestrales de la media, del total (conocida la media), de la diferencia de medias muestrales, de la proporción, del total (conocida la proporción) y de la diferencia de proporciones. Todas ellas de suma importancia en el diario quehacer de muchos campos de la investigación científica, ya que como estudiaremos más adelante, van a permitir la determinación de intervalos de confianza y la verificación de hipótesis para los parámetros poblacionales. 2.1 DISTRIBUCIÓN MUESTRAL DE LA MEDIA Teorema 3.- Si X1 , X2 , .... , Xn es una muestra aleatoria de tamaño n de una población X, con media E(X) = μ y varianza Var (X) = σ2 . Entonces, por el teorema central del límite, la media muestral n X X n i i  1 tiene aproximadamente distribución normal con media μ y varianza σ2 /n. )/,( 2 nNX  . Y la variable aleatoria n X Z / )(    tiene aproximadamente distribución N(0, 1). Este teorema es válido para cualquier población finita o infinita, discreta o continua, cuando el tamaño de la muestra n ≥ 30. Si la población es normal, se cumple cualquiera sea el tamaño n de la muestra. Cuando la población es finita de N elementos y el muestreo es sin reemplazo, la variables aleatorias Xi no son independientes, entonces la distribución de X es hipergeométrica, con: )(XE y          1 )( 2 2 N nN n XVarX   . Luego:
  • 38. 38 Teorema 4.- Si X1 , X2 , .... , Xn es una muestra aleatoria de tamaño n extraida sin reemplazo de una población X finita de tamaño N, con media E(X) = μ y varianza Var (X) = σ2 . Entonces, la media muestral n X X n i i  1 tiene aproximadamente distribución normal con media μ y varianza          1 )( 2 2 N nN n XVarX   . Y la variable aleatoria 1 )(     N nN n X Z   tiene aproximadamente distribución N(0, 1). Ejemplo 3.- En Lima Metropolitana la botella de aceite “primor” de un litro tiene un precio promedio de S/. 5.00 y una desviación estándar de S/. 0.40. Si se toman muestras aleatorias de 50 precios, se pide calcular e interpretar: a) la probabilidad que el precio promedio muestral se encuentre entre S/. 4.85 y 5.10; b) la probabilidad que el precio medio muestral sea inferior a S/. 4.80; y c) dentro de que límites simétricos alrededor del precio promedio verdadero se encontrará el 95 % de los precios promedios muestrales. Solución.- Como datos del problema se tiene que: μ = S/. 5.00 , σ = S/. 0.40 y n = 50. n XVarX 2 2 )(    = (0.40)2 / 50 = 0.0032 .057.0 X S/. Luego: )0032.0;00.5(NX  y )1,0( 057.0 )00.5( N X Z    . Nos piden: a) P(4.85  X  5.10) =            057.0 00.510.5 057.0 00.5 057. 00.585.4 X P = = P(-2.63  Z  1.75) =  (1.75) -  (-2.63) = = 0.95994 – 0.00427 = 0.95567 Rpta. Interpretación.- el 95.567% de los precios promedios muestrales de las botellas de aceite “primor” de un litro, se encuentran entre S/. 4.85 y 5.10, para muestras de 50 precios. b) P( X < 4.80) = 00022.0)51.3() 057.0 00.580.4 057.0 00.5 (     ZP X P
  • 39. 39 Interpretación.- el 0.022% de los precios promedios muestrales de las botellas de aceite “primor” de un litro, será inferior a S/. 4.80, para muestras de 50 precios. c) Sean 5.00 – E y 5.00 + E los límites simétricos alrededor de la media μ = S/. 5.00, dentro de los cuales estará el 95 % de las X . Entonces: 0.95 = P(5.00 – E  X  5.00 + E) =   ) 057.0057.0 ( E Z E P =                          975.0 057.0 1 057.0 2 057.0057.0 EEEE  11.0)057.0(96.196.1 057.0 975.0  EZ E . Luego los límites serán: 5.00 – E= 5.00 – 0.11 = S/. 4.89 y 5.00 + 0.11 = S/. 5.11. Es decir: 0.95 = P(4.89  X  5.11) Interpretación.- el 95 % de los precios promedios muestrales de las botellas de aceite “primor” de un litro, se encuentran entre S/. 4.89 y 5.11 alrededor de μ = S/. 5.00, para muestras de 50 precios. 2.2 DISTRIBUCIÓN MUESTRAL DEL TOTAL (conocida la media) En muchas situaciones vamos a estar interesados en efectuar estimaciones de un total poblacional, conocida la media muestral, para lo cual se tiene que tener presente lo siguiente: Sí el promedio poblacional es: N X N i i  1  El total de la población se define como: NXX n i i  1 el cual es estimado por: XNNX  ˆˆ Utilizando la propiedad reproductiva de la distribución normal, el teorema central del límite y los operadores esperanza y varianza para el estimador de total, llegamos al resultado siguiente:  22 ,ˆˆ XNNNXNNX   y XN NXN Z    ~ N(0, 1) Donde la varianza del estimador del total está dada por:
  • 40. 40  n NNXVarNXNVarNVarXVar X 2 2222 )()()ˆ()ˆ(    , si la fracción de muestreo f = n / N  0.05 , o  1 )()()ˆ()ˆ( 2 2222    N nN n NNXVarNXNVarNVarXVar X   , si la fracción de muestreo f = n / N > 0.05. 2.3 DISTRIBUCIÓN DE LA DIFERENCIA DE MEDIAS MUESTRALES Esta distribución va a surgir cuando estemos interesados en efectuar la comparación de las medias de dos poblaciones. Por ejemplo: comparar el precio promedio poblacional de un bien o servicio en la ciudad X (μX ) y el precio promedio poblacional del mismo bien o servicio en la ciudad Y (μY ). O comparar los ingresos promedios, ventas promedios, los rendimientos promedios, etc. no sólo entre ciudades, sino también entre grupos. Esta comparación se formula así: ¿Serán iguales los precios promedios de un bien o servicio en las ciudades X e Y (o en las ciudades 1 y 2)? Que es idéntico a plantearse ¿μX = μY o μX – μY = 0? o también ¿μ1 = μ2 o μ1 – μ2 = 0? Es decir, que esta comparación se reduce a conocer la diferencia de medias poblacionales, la misma que va a requerir tomar muestras aleatorias de ambas poblaciones y estudiar el comportamiento de la media muestral en cada una de ellas, de la siguiente manera:  Sea X1 , X2 , .... , Xn es una muestra aleatoria de tamaño n, de una población X de tamaño N, con media E(X) = μX y varianza Var (X) = 2 X . Sabemos que la media muestral n X X n i i  1 tiene aproximadamente distribución normal: ),( 2 XXNX  . Donde: n X X 2 2    o          1 )( 2 2 N nN n XVar X X   ..... (1)  Sea Y1 , Y2 , .... , Ym una muestra aleatoria de tamaño m, de una población Y de tamaño M, con media E(Y) = μY y varianza Var (Y) = 2 Y . Sabemos que la media muestral m Y Y m i i  1 tiene aproximadamente distribución normal:
  • 41. 41 ),( 2 YYNY  . Donde: m Y Y 2 2    o          1 )( 2 2 M mM m YVar Y Y   ..... (2)  De (1) y (2) tenemos que X - Y es una variable aleatoria con media:       YXYXYX YEXEYXE   y varianza:       222 YXYX YVarXVarYXVar   2 YX  = n X 2  + m Y 2  o         1 2 N nN n X +         1 2 M mM m Y .............. (3) Además, por la propiedad reproductiva de la distribución normal, de (1) y (2) se tiene que: X - Y ~ N( YX   , 2 YX  ) y YX YXYX Z      )( ) ~ N(0 , 1) donde YX  se obtiene a partir de (3). Sintetizamos lo expuesto hasta aquí en el teorema 5. Teorema 5.- Si X y Y son las medias de dos muestras aleatorias (de tamaños n y m) de dos poblaciones X e Y, con medias μX y μY , y varianzas Var (X) = 2 X y Var (Y) = 2 Y , respectivamente, entonces la distribución muestral de la diferencia de medias es aproximadamente normal N( YX   , 2 YX  ) y la variable aleatoria mn YX Z YX YX 22 ) )(      o                   11 )( 22 ) M mM mN nN n YX Z YX YX   tiene aproximadamente distribución normal estándar N(0 , 1). Si n y m son mayores o iguales que 30, la aproximación a la normal para la diferencia de medias muestrales es óptima. Si las poblaciones X e Y son normales, el teorema se cumple para cualesquier tamaño de muestra. Ejemplo 4.- Ciertas bolsas de café tienen un peso medio de 500 gr. y una desviación estándar de 20 gr. Cierto día de producción se toman independientemente dos muestras al azar sin reposición, con n = 500 y m = 800. ¿Cuál es la probabilidad que los pesos medios
  • 42. 42 de las dos muestras difieran a) en más de 2 gr.? y b) en menos de 1gr.? Interpretar los resultados. Solución.- Sea X la muestra de tamaño n = 500 bolsas de café, con μX = 500 gr. y X = 20 gr. Sea Y la muestra de tamaño m = 800 bolsas de café, con μY = 500 gr. y Y = 20 gr. Luego: YX  = YX   = 500 – 500 = 0, 2 YX  = n X 2  + m Y 2  = 800 20 500 20 22  = 1.3 y YX  = 1.14 gr. Además, X - Y ~ N(0, 1.3) y 14.1 0  YX Z ~ N(0 , 1). Nos piden: a) P ( X - Y > 2 ) = 1 - P ( X - Y  2 ) = 1 - P(-2  X - Y  2) = = 1 -            14.1 02 14.1 0 14.1 02 YX P = 1 - P(-1.75  Z  1.75) = = 1 – [ (1.75) -  (-1.75)] = 1 - [ (1.75) – 1 +  (1.75)] = = 2 – 2  (1.75) = 2 – 2 (0.95994) = 0.08012 Rpta. Interpretación.- en el 8.01% de las comparaciones, para muestras de 500 y 800 bolsas de café respectivamente, las diferencias de pesos medios serán mayores a 2 gramos. b) P ( X - Y < 1 ) = P( -1 < X - Y < 1) = =            14.1 01 14.1 0 14.1 01 YX P = P(-0.88  Z  0.88) = = (0.88) - (-0.88) = 0.81057 – 0.18943 = 0.62114 Rpta. Interpretación.- en el 62.11% de las comparaciones, para muestras de 500 y 800 bolsas de café respectivamente, las diferencias de pesos medios serán menores de 1 gramo.
  • 43. 43 2.4 DISTRIBUCIÓN MUESTRAL DE LA PROPORCIÓN En muchos estudios vamos a estar interesados en clasificar los datos cualitativos o cuantitativos de la población en dos clases distintas (población dicotómica o binomial) tales como: éxitos y fracasos; hombres y mujeres; a favor y en contra; aprueba y desaprueba; jóvenes (menores de x años) y adultos (de x años y más); caras y sellos; empleados y desempleados; etc. En este caso, se desea estimar la proporción de unidades (P) o el número total de unidades (A) en la población que poseen una cierta característica o atributo que cae dentro de una clase definida. Por ejemplo, se desea estimar: - El porcentaje (o número) de personas que consumen un cierto producto. - El porcentaje (o número) de clientes que compran más de 10 000 dólares mensuales. - El porcentaje (o número) de ciudadanos que está a favor de un personaje. Notación: Además de la notación usada anteriormente, si se define la v.a. Bernoulli: Xi = 1, si la unidad estadística observada posee la característica de interés (éxito). Xi = 0, si la unidad estadística no posee la característica de interés (fracaso). Entonces: N X PyXA N i iN i i      1 1 representan el número total de unidades (A) y la proporción (P) de unidades en la población que poseen una cierta característica. Suponga que se extrae una muestra aleatoria simple de tamaño n de la población binomial, entonces la proporción muestral p definida como: .,1 Paestima n X n X p n i i  
  • 44. 44 X =  n i iX 1 = número de éxitos en la muestra es una v.a. Binomial (n, P). La proporción muestral p, es una media muestral de v.a. Bernoulli con E(Xi ) = P y V(Xi ) = P Q; representa la proporción de éxitos en la muestra y estima a la proporción de éxitos en la población P. Es decir, que p tiene el mismo comportamiento de una media muestral X . Por lo tanto:  PnP n P n XE nn X EpE n i n i i n i i                   )( 11 )( 1 )( 11 1  2 11 )( )( n XVar n X VarpVar n i i n i i                 (propiedad de la varianza) 2 22 1 2 1 )( p n i n i i n PQ n nPQ n PQ n XVar    Luego:         n PQ PN n X n X p n i i ,1 y n PQ Pp Z   ~ N(0, 1) Si el muestreo se efectúa sin reemplazo de una población binomial finita, la distribución muestral de p sigue la distribución hipergeométrica y su varianza requiere el factor de corrección para poblaciones finitas (salvo que la fracción de muestreo f = n/N sea menor del 5%, donde no se utiliza). Entonces:                 1 ,1 N nN n PQ PN n X n X p n i i
  • 45. 45 y           1N nN n PQ Pp Z ~ N(0, 1) Ejemplo 5.- Según el Censo Nacional de Talla en Escolares de 19991 la desnutrición crónica en el Perú era del 27.9%. Si se toma una muestra al azar sin reposición, de n = 1500 niños y niñas. Calcule e interprete la probabilidad que: a) la desnutrición crónica muestral se encuentre entre 26 y 30%? y b) dentro de que límites simétricos alrededor de la proporción verdadera de desnutridos crónicos se encontrará el 95% de las proporciones muestrales. Solución.- El mencionado Censo tiene los siguientes datos: N = 2 059 426 niños y niñas censados como casos válidos = tamaño de la población. X =  N i iX 1 = 574 314 niños y niñas desnutridos crónicos. 426,059'2 314,5741   N X N X P N i i = 0.279 = proporción censal de niños y niñas con desnutrición crónica. Q = 0.721 = proporción censal de niños y niñas sin desnutrición crónica. n = 1500 niños y niñas = tamaño de la muestra. Como la fracción de muestreo n/N es menor de 0.05, entonces, la proporción muestral: 1 Ministerio de Educación. Nutrición y Retardo en el Crecimiento. Resultados del II Censo Nacional de Talla en Escolares 1999. Lima, Perú, Noviembre de 2000.
  • 46. 46  0001341.0;279.0,1 N n PQ PN n X n X p n i i         y 0116.0 279.0 0001341.0 279.0       pp n PQ Pp Z ~ N(0, 1) Se pide calcular: a) P ( 0.26  p  0.30 ) =            0116.0 279.030.0 0116.0 279.0 0116.0 279.026.0 p P = P( -1.64  Z  1.81 ) =  (1.81) -  (-1.64) = = 0.96485 – 0.05050 = 0.91435 Rpta. Interpretación.- en el 91.44 % de las muestras de 1500 niños y niñas a nivel nacional, el porcentaje de desnutridos crónicos, se encuentra entre el 26 y 30 %. b) Sean 0.279 – E y 0.279 + E los límites simétricos alrededor de la proporción verdadera P = 0.279 , dentro de los cuales estará el 95 % de las p. Entonces: 0.95 = P(0.279 – E  p  0.279 + E) =   ) 0116.00116.0 ( E Z E P =                          975.0 0116.0 1 0116.0 2 0116.00116.0 EEEE  023.0)0116.0(96.196.1 0116.0 975.0  EZ E . Luego los límites serán: 0.279 – E = 0.279 – 0.023 = 0.256 y 0.279 + 0.023 = 0.302 . Es decir: 0.95 = P(0.256  p  0.302 ) Rpta. Interpretación.- en el 95 % de las muestras de 1500 niños y niñas a nivel nacional, la proporción de desnutridos crónicos se encontrará entre 0.256 y 0.302 alrededor de la proporción verdadera P = 0.279.
  • 47. 47 2.5 DISTRIBUCIÓN MUESTRAL DEL TOTAL (conocida la proporción) En muchas situaciones vamos a estar interesados en efectuar estimaciones de un total poblacional, conocida la proporción muestral, para lo cual se tiene que tener presente lo siguiente: Sí N X P N i i  1 representa la proporción (P) de unidades en la población que poseen una cierta característica y   N i iXA 1 el número total (A) de unidades que poseen dicha característica. Entonces: El total de la población se define como: NPXA N i i  1 el cual es estimado por: NpPNA  ˆˆ Utilizando la propiedad reproductiva de la distribución normal, el teorema central del límite y los operadores esperanza y varianza para el estimador de total, llegamos al resultado siguiente:  22 ,ˆˆ pNNPNNpPNA  y pN NPNp Z    ~ N(0, 1) Donde la varianza del estimador del total está dada por:  n PQ NNpVarNNpVarPNVarAVar p 2222 )()()ˆ()ˆ(   , si la fracción de muestreo f = n / N  0.05 , o           1 )()()ˆ()ˆ( 2222 N nN n PQ NNpVarNNpVarPNVarAVar p , si la fracción de muestreo f = n / N > 0.05.
  • 48. 48 2.6 DISTRIBUCIÓN MUESTRAL DE LA DIFERENCIA DE PROPORCIONES Esta distribución surge cuando estemos interesados en efectuar la comparación de las proporciones de dos poblaciones. Por ejemplo: comparar la proporción poblacional de individuos que prefiere un bien o servicio en la ciudad 1 (P1 ) y la proporción poblacional de individuos que prefiere el mismo bien o servicio en la ciudad 2 (P2 ). Comparar las proporciones de aceptación no sólo entre ciudades, sino también entre grupos. Esta comparación se formula así: ¿Serán iguales las proporciones poblacionales de individuos que prefieren un bien o servicio en las ciudades 1 y 2? Que es idéntico a plantearse ¿ P1 = P2 o P1 – P2 = 0 ? Es decir, que esta comparación se reduce a conocer la diferencia de proporciones poblacionales, la misma que va a requerir tomar muestras aleatorias de ambas poblaciones y estudiar el comportamiento de la proporción muestral en cada una de ellas y de la diferencia p1 – p2 de la siguiente manera:  Suponga que se extrae una muestra aleatoria simple de tamaño n1 de la población binomial 1, de tamaño N1 con una proporción de éxitos igual a P1. Sea X1 el número de éxitos en la muestra de tamaño n1 , entonces la proporción muestral de éxitos p1 , definida como 1 1 1 n X p  estima a P1 y para n1 suficientemente grande tiene aproximadamente distribución normal: ),( 2 11 1pPNp  . Donde: 1 112 1 n QP p  o          11 11 1 112 1 N nN n QP p ..... (1)  Suponga que se extrae una muestra aleatoria simple de tamaño n2 de la población binomial 2, de tamaño N2 con una proporción de éxitos igual a P2. Sea X2 el número de éxitos en la muestra de tamaño n2 , entonces la proporción muestral de éxitos p2 , definida como 2 2 2 n X p  estima a P2 y para n2 suficientemente grande tiene aproximadamente distribución normal:
  • 49. 49 ),( 2 22 2pPNp  . Donde: 2 222 2 n QP p  o          12 22 2 222 2 N nN n QP p ..... (2)  Siendo p1 y p2 variables aleatorias independientes, cuyas distribuciones están dadas en (1) y (2) tenemos que p1 – p2 es una variable aleatoria con media:       212121 2121 PPpEpEppE pppp   y varianza:       22 2121 2 2121 pppp pVarpVarppVar   2 21 pp  = 1 11 n QP + 2 22 n QP o         11 11 1 11 N nN n QP +         12 22 2 22 N nN n QP ............. (3) Además, por la propiedad reproductiva de la distribución normal, de (1) y (2) se tiene que: p1 – p2 ~ N(P1 – P2 , 2 21 pp  ) y 21 )( 2121 pp PPpp Z     ~ N(0 , 1) donde 21 pp  se obtiene a partir de (3). Sintetizamos lo expuesto hasta aquí en el teorema 6. Teorema 6.- Si p1 y p2 son las proporciones de dos muestras aleatorias (de tamaños n1 y n2 ) de las poblaciones binomiales 1 y 2, respectivamente, entonces la distribución muestral de la diferencia de proporciones p1 - p2 ~ N(P1 – P2 , 2 21 pp  ) y la variable aleatoria 2 22 1 11 2121 )( n QP n QP PPpp Z    o                   11 )( 2 22 2 22 1 11 1 11 2121 N nN n QP N nN n QP PPpp Z tiene aproximadamente distribución normal estándar N(0 , 1).
  • 50. 50 Si n1 y n2 son mayores o iguales que 30, la aproximación a la normal para la diferencia de proporciones muestrales es óptima. Ejemplo 6.- Una empresa que trabaja en ciudades grandes, considera que el nivel de aceptación de su producto en los hogares de la ciudad 1 es de un 35% y en la ciudad 2 de un 30%. Si se toma una muestra aleatoria de 400 hogares de cada ciudad. ¿Cuál es la probabilidad que la diferencia de proporciones muestrales de hogares que prefieren el producto en ambas ciudades sea menor al 8%? Interpretar el resultado. Solución.- P1 = 0.35 = proporción de hogares que prefiere el producto en la ciudad 1. Q1 = 1 – P1 = 0.65 = proporción de hogares que no prefiere el producto en la ciudad 1. P2 = 0.30 = proporción de hogares que prefiere el producto en la ciudad 2. Q2 = 1 – P2 = 0.70 = proporción de hogares que no prefiere el producto en la ciudad 2. n1 = n2 = 400 hogares (tamaño de la muestra en ambas ciudades) Considerando que ambas ciudades son grandes y que las correspondientes fracciones de muestreo son menores al 5% (f = n / N < 0.05) se tiene que: p1 – p2 ~ N(P1 – P2 , 2 21 pp  ) Con media: 2121 PPpp  = 0.35 – 0.30 = 0.05 Y varianza: 2 21 pp  = 1 11 n QP + 2 22 n QP = 400 )65.0)(35.0( 400 )65.0)(35.0(  = 0.0011 . Luego: p1 – p2 ~ N(0.05 ; 0.0011) y 0331.0 05.0)( 212121 21      ppPPpp Z pp ~ N(0 , 1)
  • 51. 51 Se pide calcular: P (p1 – p2  0.08 ) = P(-0.08  p1 – p2  0.08) = =            0331.0 05.008.0 0331.0 05.0 0331.0 05.008.0 21 pp P = = P(-3.93  Z  0.91) =  (0.91) -  (-3.93) = = 0.81859 – 0.00004 = 0.81855 Rpta. Interpretación.- en el 81.86% de las comparaciones, para muestras de 400 hogares de cada ciudad, las diferencias de proporciones muestrales de hogares que prefieren el producto en ambas ciudades será menor al 8%.
  • 52. 52 2.7 EJERCICIOS RESUELTOS 1. Si se toma una muestra aleatoria de tamaño n, de una población X con distribución Bernoulli, con parámetro p, hallar la función de probabilidad conjunta (o de verosimilitud) para dicha muestra. Solución Si la variable aleatoria. X ~ Bernoulli (p), entonces cada Xi ~ Bernoulli (p) y su función de probabilidad es: 1 ( ) , 1,2,....,i ix x X if x p q i n    ; xi = 0 y 1. Luego la función de probabilidad conjunta o de verosimilitud será: 1 2 1 2( , ,...., ) ( ) ( ).... ( )n X X X nf x x x f x f x f x  1 1x x p q   2 2x x p q    .... n nx x p q   = 1 1 n n i i i i x n x p q    , xi = 0 y 1;  i = 1, 2, .... , n . Rpta. 2. Si se toma una muestra aleatoria de tamaño m, de una población X con distribución binomial, con parámetros n y p, hallar la función de probabilidad conjunta (o de verosimilitud) para dicha muestra. Solución Como la variable aleatoria X ~ B(n, p), entonces cada Xi ~ B(n, p) y su función de probabilidad es: ( ) , 1,2,....,i i xi x n x X i nf x C p q i m    ; xi = 0, 1, 2, 3, .... , n Luego la función de probabilidad conjunta o de verosimilitud será: 1 2 1 2( , ,...., ) ( ) ( ).... ( )n X X X nf x x x f x f x f x  = 1 1 1 x n x n xC p q     2 2 2 x n x n xC p q      .... m m m x n x n xC p q     = 1 1 1 m m i i i i i m x m x n x i C p q            , xi = 0, 1, 2,....,n;  i = 1, 2, ..., m . Rpta. 3. Si se toma una muestra aleatoria de tamaño n, de una población X con distribución de Pareto, con parámetro B, hallar la función de probabilidad conjunta (o de verosimilitud) para dicha muestra.
  • 53. 53 Solución Si la variable aleatoria. X ~ Pareto (B), entonces cada Xi ~ Pareto (B) y su función de probabilidad es: 0 01 ( ) , , 1,2,...., B X i iB i BX f x X X i n X      . Donde: B = Coeficiente de Pareto > 0. Xo = Ingreso mínimo. Luego la función de probabilidad conjunta o de verosimilitud será: 1 2 1 2( , ,...., ) ( ) ( ).... ( )n X X X nf x x x f x f x f x  0 1 1 B B BX X        0 1 1 B B BX X         .... 0 1 1 B B BX X        0 0 1 1 ; , 1,2,...., n nB in B i i B X X X i n X                  , Rpta. 4. Si se toma una muestra aleatoria de tamaño n, de una población X con distribución log-normal, con parámetros μ y σ2 , hallar la función de probabilidad conjunta (o de verosimilitud) para dicha muestra. Solución Como la variable aleatoria X ~ LN (μ , σ2 ), entonces cada Xi ~ LN (μ , σ2 ) y su función de probabilidad esta dada por: 2 2 (ln ) /2 2 1 ( ) ; 0, 2 ix X i i i f x e x x         i = 1, 2, ...., n. Luego la función de densidad conjunta o de verosimilitud será: 1 2 1 2( , ,...., ) ( ) ( ).... ( )n X X X nf x x x f x f x f x  = 2 2 1(ln ) /2 2 1 1 2 x e x             2 2 2(ln ) /2 2 2 1 2 x e x              .... 2 2 (ln ) /2 2 1 2 nx n e x             = = 2 2 1 (ln ) /22 2 1 1 1 ; 0, 2 n i i n x in i i e x x               i = 1, 2, 3, .... , n. Rpta.
  • 54. 54 5. Las botellas de aceite para motor de carros tienen un contenido medio de 2.0 litros y una desviación estándar de 0.12 litros. Si se toma una muestra aleatoria de 36 botellas, Calcule e interprete la probabilidad que: a) Las botellas tengan una media de llenado entre 1.96 y 2.03 litros. b) ¿Dentro de qué límites simétricos caerá el 95 % de las medias muestrales alrededor de la media poblacional? Solución Los datos del problema son: μ = 2.0 lts., σ = 0.12 lts. y n = 36 botellas. n XVarX 2 2 )(    = (0.12)2 / 36 = 0.0004 X   0.02 lts. Luego: 2 ( , )X X N   = N(2.00, 0.0004) y ( 2.00) (0,1) 0.02 X Z N    . Nos piden: a) P(1.96  X  2.03) = 1.96 2.00 2.00 2.03 2.00 0.02 0.02 0.02 X P          = P(-2.0  Z  1.5) =  (1.5) -  (-2.0) = = 0.93319 – 0.02275 = 0.91044 Rpta. 20 15 10 5 0 X = media muestral Densidad 1.96 0.9104 2.032.00 Distribución contenido medio de aceite Normal, Media=2, Desv.Est.=0.02 lts. Resultado gráfico en Minitab
  • 55. 55 Interpretación.- en el 91.04% de las (ó en 9104 de cada 10000) muestras de 36 botellas de aceite para motor de carro de dos litros, el contenido medio está entre 1.96 y 2.03 litros. b) Sean 2.00 – E y 2.00 + E los límites simétricos alrededor de la media μ = 2.0 lts., dentro de los cuales estará el 95 % de las X . Entonces: 0.95 = P(2.00 – E  X  2.00 + E) = ( ) 0.02 0.02 E E P Z     = 2 1 0.975 0.02 0.02 0.02 0.02 E E E E                                  0.975 0.02 E Z = 1.96 → E = 1.96 x 0.02 = 0.039 lts. Luego los límites serán: 2.00 – E = 2.00 – 0.039 = 1.961 lts. y 2.00 + 0.039 = 2.039 lts. Es decir: 0.95 = P(1.961  X  2.039) Rpta. Interpretación.- en el 95% de las (ó en 9500 de cada 10000) muestras de 36 botellas de aceite para motor de carro de dos litros, el contenido medio está entre 1.961 y 2.039 lts. alrededor de μ = 2.0 lts. 6. Una estación de servicio de una ciudad grande ha encontrado que sus ventas semanales de petróleo tienen un promedio de 15 galones por cliente con una desviación estándar de 2.8. Para una muestra aleatoria de 49 clientes, calcule e interprete: a) La probabilidad de que la compra promedio semanal de petróleo sea menor de 14 galones; b) ¿Dentro de qué límites simétricos caerá el 99% de las medias muestrales alrededor de la media poblacional? Solución Los datos del problema son: μ = 15 glns., σ = 2.8 glns. y n = 49 clientes. n XVarX 2 2 )(    = (2.8)2 / 49 = 0.16 X   0.4 glns.
  • 56. 56 Entonces: 2 ( , )X X N   = N(15, 0.16) y ( 15) 0.4 X Z    N(0, 1). Nos piden: a) P( X < 14) = 15 14 15 0.4 0.4 X P        = P(Z < -2.5) =  (-2.5) = 0.00621 Rpta. Interpretación.- en el 0.621% de las (ó en 62 de cada 10000) muestras de 49 clientes de petróleo, la compra media es menor a 14 galones. b) Sean 15 – E y 15 + E los límites simétricos alrededor de la media μ = 15 glns., dentro de los cuales caerá el 99 % de las X . Entonces: 0.99 = P(15 – E  X  15 + E) = ( ) 0.4 0.4 E E P Z     = 2 1 0.995 0.4 0.4 0.4 0.4 E E E E                                  0.995 0.4 E Z = 2.575 → E = 2.575 x 0.4 = 1.03 glns. Luego los límites serán: 15 – E = 15 – 1.03 = 13.97 glns. y 15 + 1.03 = 16.03 glns. Es decir: 0.99 = P(13.97  X  16.03) Rpta. 1.0 0.8 0.6 0.4 0.2 0.0 X = media muestral Densidad 13.97 0.99 16.0315 Normal, Media=15, Desv.Est.=0.4 Distribución compra media de petróleo Resultado gráfico en Minitab
  • 57. 57 Interpretación.- en el 99% de las (ó en 9900 de cada 10000) muestras de 49 clientes de petróleo, la venta media se encuentra entre 13.97 y 16.03 glns. alrededor de μ = 15 glns. 7. La compañía “Yapatera” vende bolsas de azúcar con un contenido medio de 5 kilos y una desviación estándar de 0.2 kilos. Si se toma muestras al azar de 36 bolsas. Calcule e interprete: a) La probabilidad de que el peso medio de la muestra supere los 5.1 kilos. b) ¿Dentro de que límites simétricos alrededor de la media poblacional caerá el 90% de los pesos medios muestrales? Solución Los datos del problema son: μ = 5 Kg., σ = 0.2 Kg. y n = 36 bolsas. n XVarX 2 2 )(    = (0.2)2 / 36 = 0.0011 X   0.033 Kg. Entonces: 2 ( , )X X N   = N(5, 0.0011) y ( 5) 0.033 X Z    N(0, 1). Se pide: a) P( X > 5.1) = 5 5.1 5 0.033 0.033 X P        = P(Z > 3.03) = 1 -  (3.03) = = 1 - 0.99878 = 0.00122 Rpta. Interpretación.- en el 0.12% de las (ó en 12 de cada 10000) muestras de 36 bolsas de azúcar, el peso medio supera los 5.1 kilos. b) Sean 5 – E y 5 + E los límites simétricos alrededor de la media μ = 5 Kg., dentro de los cuales caerá el 90 % de las X . Entonces: 0.90 = P(5 – E  X  5 + E) = ( ) 0.033 0.033 E E P Z     = 2 1 0.95 0.033 0.033 0.033 0.033 E E E E                                  0.95 0.033 E Z = 1.645 → E = 1.645 x 0.033 = 0.054 Kg. Luego los límites serán:
  • 58. 58 5 – E = 5 – 0.054 = 4.946 Kg. y 5 + 0.054 = 5.054 Kg. Es decir: 0.90 = P(4.946  X  5.054) Rpta. Interpretación.- en el 90% de las (ó en 9000 de cada 10000) muestras de 36 bolsas de azúcar, el contenido medio se encuentra entre 4.946 y 5.054 Kg. alrededor de μ = 5 Kg. 8. En Lima el precio promedio al consumidor del kilo de arroz es μ = S/. 3.20 con una desviación estándar σ = S/. 0.25. Si se selecciona una muestra aleatoria de 100 consumidores de arroz, calcule e interprete: a) La probabilidad que el precio medio muestral del arroz sea mayor a S/. 3.25 el kilo. b) ¿Dentro de que límites simétricos caerá el 95% de los precios medios muestrales alrededor de la media poblacional? Solución Los datos del problema son: μ = S/. 3.20, σ = S/. 0.25. y n = 100 consumidores. n XVarX 2 2 )(    = (0.25)2 / 100 = 0.000625 X   S/. 0.025 Entonces: 2 ( , )X X N   = N(3.20, 0.000625) y ( 3.20) 0.025 X Z    N(0, 1). Se pide: a) P( X > 3.25) = 3.20 3.25 3.20 0.025 0.025 X P        = P(Z > 2.0) = 1 -  (2.00) = = 1 - 0.97725 = 0.02275 Rpta. Interpretación.- en el 2.28% de las (ó en 228 de cada 10000) muestras de 100 consumidores de arroz, el precio medio del kilo es mayor a S/. 3.25. b) Sean 3.20 – E y 3.20 + E los límites simétricos alrededor de la media μ = S/. 3.20, dentro de los cuales caerá el 95 % de las X . Entonces: 0.95 = P(3.20 – E  X  3.20 + E) = ( ) 0.025 0.025 E E P Z    
  • 59. 59 = 2 1 0.975 0.025 0.025 0.025 0.025 E E E E                                  0.975 0.025 E Z = 1.96 → E = 1.96 x 0.025 = S/. 0.05. Luego los límites serán: 3.20 – E = 3.20 – 0.05 = S/. 3.15 y 3.20 + 0.05 = S/. 3.25. Es decir: 0.95 = P(3.15  X 3.25) Rpta. Interpretación.- en el 95% de las (ó en 9500 de cada 10000) muestras de 100 consumidores de arroz, el precio medio del kilo se encuentra entre 3.15 y 3.25 nuevos soles alrededor de μ = S/. 3.20. 9. La compañía “La negrita” vende latas de café con un contenido medio de 195 gramos y una desviación estándar de 6 gramos. Si se toman muestras al azar de 25 latas. Calcule e interprete: a) La probabilidad de que el peso medio de la muestra sea menor de 192 gramos. b) ¿Dentro de que límites simétricos alrededor de la media poblacional caerá el 99.73% de los pesos medios muestrales? Solución Los datos del problema son: μ = 195 gr., σ = 6 gr. y n = 25 latas. n XVarX 2 2 )(    = (6)2 / 25 = 1.44 X   1.2 gr. Entonces: 2 ( , )X X N   = N(195, 1.44) y ( 195) 1.2 X Z    N(0, 1). Se pide: a) P( X < 192) = 195 192 195 1.2 1.2 X P        = P(Z < -2.5) =  (-2.50) = 0.00621 Interpretación.- en el 0.62% de las (ó en 62 de cada 10000) muestras de 25 latas de café, el peso medio es menor 192 gr. b) Sean 195 – E y 195 + E los límites simétricos alrededor de la media μ = 195 gr, dentro de los cuales caerá el 99.73 % de las X . Entonces:
  • 60. 60 0.9973 = P(195 – E  X  195 + E) = ( ) 1.2 1.2 E E P Z     = 2 1 0.99865 1.2 1.2 1.2 1.2 E E E E                                  0.99865 1.2 E Z = 3.0 → E = 3 x 1.2 = 3.6 gr. Luego los límites serán: 195 – E = 3.6 – 0.05 = 191.4 gr. y 195 + 3.6 = 198.6 gr. Es decir: 0.9973 = P(191.4  X  198.6) Rpta. Interpretación.- en el 99.73% de las (ó en 9973 de cada 10000) muestras de 25 latas de café, el peso medio se encuentra entre 191.4 y 198.6 gr. alrededor de μ = 195 gr. 10. Se sabe que en la ciudad A el gasto medio mensual en arbitrios es de S/. 250, con una desviación típica de S/. 60; mientras que en la ciudad B dicho gasto medio mensual es de S/. 235, con una desviación típica de S/. 50. En una auditoría para determinar el gasto medio mensual en arbitrios en las ciudades A y B, se toma una muestra al azar de 300 hogares de cada ciudad. Calcule e interprete la probabilidad de que: a) El gasto medio mensual en arbitrios en la ciudad B sea mayor que en la ciudad A. b) El gasto medio mensual en arbitrios en la ciudad A sea al menos S/. 25 más que el gasto medio mensual en arbitrios en la ciudad B. Solución Los datos del problema son: μA = S/. 250, σA = S/. 35 y nA = 300 hogares. μB = S/. 235, σA = S/. 20 y nB = 300 hogares. Luego: 2 2 2 (60) ( ) 300A A AX A Var X n      = 12.00 y 2 2 2 (50) ( ) 300B B BX B Var X n      = 8.33
  • 61. 61 A B A BX X      = 250 - 235 = 15, 2 2 2 A BA B x xX X      = 12 + 8.33 = 20.33 y A BX X   = 4.51. Luego: 2 ( , )A BA B A B X X X X N        = N(15, 20.33) y ( 15) 4.51 A BX X Z     N(0, 1). Se pide: a) P( BX > AX ) = P( AX < BX ) = P( AX - BX < 0) = ( 15) 0 15 4.51 4.51 A BX X P         = = P(Z < -3.33) =  (-3.33) = 0.00043 Rpta. Interpretación.- en el 0.04% de las (ó en 4 de cada 10000) muestras de 300 hogares de cada ciudad, el gasto medio mensual en arbitrios en la ciudad B será mayor que en la ciudad A. b)  25A BP X X  = 1 -  25A BP X X  = 1 - 15 25 15 4.51 4.51 A BX X P         = = 1 – P(Z < 2.22) = 1 -  (2.22) = = 1 – 0.98679 = 0.01321 Rpta. Interpretación.- en el 1.32% de las (ó en 132 de cada 10000) muestras de 300 hogares de cada ciudad, el gasto medio mensual en arbitrios en la ciudad A será al menos S/. 25 más que el gasto medio mensual en arbitrios en la ciudad B. 11. Dos fábricas A y B productoras de bombillas afirman que el promedio de duración de ellas es de 1980 y 1950 horas, respectivamente, con desviaciones típicas de 90 y 100 horas. Si se seleccionan 100 bombillas al azar de cada fábrica, calcule e interprete la probabilidad de que: a) Las bombillas B tengan una duración media menor de 1930 horas. b) Las bombillas B tengan una duración media mayor que la duración media de las bombillas A.
  • 62. 62 Solución Los datos del problema son: μA = 1980 horas, σA = 90 horas y nA = 100 bombillas. μB = 1950 horas, σB = 100 horas y nB = 100 bombillas. Luego: 2 2 ( )A A AX A Var X n     = (90)2 / 100 = 81 y 2 2 ( )B B BX B Var X n     = (100)2 / 100 = 100 a) 2 ( , )BB B X X N   = N(1950, 81) y ( 1950) 9 BX Z    N(0, 1). Se pide: P( BX < 1930) = 1950 1930 1950 9 9 BX P        = P(Z < -2.22) = =  (-2.22) = 0.01321 Rpta. Interpretación.- en el 1.32% de las (ó en 132 de cada 10000) muestras de 100 bombillas B, la duración media menor de 1930 horas. b) A B A BX X      = 1980 - 1950 = 30, 2 2 2 A BA B x xX X      = 81 + 100 = 181 y A BX X   = 13.45. Luego: 2 ( , )A BA B A B X X X X N        = N(30, 181) y ( 30) 13.45 A BX X Z     N(0, 1). Se pide: P( BX > AX ) = P( AX < BX ) = P( AX - BX < 0) = ( 30) 0 30 13.45 13.45 A BX X P         = = P(Z < -2.23) =  (-2.23) = 0.01287 Rpta. Interpretación.- en el 1.29% de las (ó en 129 de cada 10000) muestras de 100 bombillas A y 100 bombillas B, la duración media de las bombillas B es mayor que la duración media de las bombillas A. 12. Un proceso automático es realizado por dos máquinas que empaquetan un producto en bolsas de 500 gramos. La máquina 1 llena con una desviación estándar de 15 gramos y la máquina 2 de 20 gramos. Si se seleccionan muestras de 100 bolsas de cada máquina, calcule e interprete la probabilidad de que: a) El llenado medio de la máquina 1 sea menor que el llenado medio de la máq. 2.
  • 63. 63 b) Las medias muestrales difieran en menos de 2 gramos. Solución Los datos del problema son: μ1 = 500 gr., σ1 = 15 gr. y n1 = 100 bolsas. μ2 = 500 gr., σ2 = 20 gr. y n2 = 100 bolsas. Luego: 1 2 2 1 1 1 ( )X Var X n     = (15)2 / 100 = 2.25 y 2 2 2 2 2 2 ( )X Var X n     = (20)2 / 100 = 4. 1 2 1 2X X      = 500 - 500 = 0, 1 21 2 2 2 2 x xX X      = 2.25 + 4 = 6.25 y A BX X   = 2.5. Luego: 1 2 2 1 2 1 2( , )X X X X N        = N(0, 6.25) y 1 2( 0) 2.5 X X Z     N(0, 1). Se pide: a) P( 1X < 2X ) = P( 1X - 2X < 0) = 1 2( 0) 0 0 2.5 2.5 X X P         = = P(Z < 0) =  (0) = 0.5000 Rpta. Interpretación.- en el 50% de las (ó en 5000 de cada 10000) muestras de 100 bolsas de la máquina 1 y 100 bolsas de la máquina 2, el llenado medio de la máquina 1 es menor que el llenado medio de la máquina 2. b)  1 2 2P X X  =  1 22 2P X X    = 1 2 02 0 2 0 2.5 2.5 2.5 X X P           = = P(-0.80 < Z < 0.80) = 2  (0.80) - 1 = = 2 (0.78814) – 1 = 0.57628 Rpta. Interpretación.- en el 57.63% de las (ó en 5763 de cada 10000) muestras de 100 bolsas de cada máquina, las medias muestrales difieren en 2 gramos. 13. Según un estudio del Ministerio de Salud,2 en el Perú los varones de 9 años de edad tienen un peso promedio de 26.8 Kg. y una desviación estándar de 2.5 Kg., mientras que las mujeres tienen un peso promedio de 26.7 Kg. y una desviación estándar de 3.8 Kg. Si se toman independientemente dos muestras al azar sin reposición, de n = 300 niños y m = 300 niñas. Calcule e interprete la probabilidad de que: 2 Ministerio de Salud. Informe del estado nutricional en el Perú. Componente nutricional ENAHO-CENAN Julio 2009 – Junio 2010, CENAN – INEI,.. Lima, Perú, 2011.
  • 64. 64 a) El peso promedio de los niños sea menor que el peso promedio de las niñas. b) El peso promedio de los niños sea al menos 0.6 kg. más que el peso promedio de las niñas. Solución Los datos del problema son: μv = 26.8 Kg., σv = 2.5 Kg. y nv = 300 niños. μm = 26.7 Kg., σm = 3.8 Kg. y nm = 300 niñas. Luego: 2 2 ( )v v vX v Var X n     = (2.5)2 / 300 = 0.02083 y 2 2 ( )m m mX m Var X n     = (3.8)2 / 300 = 0.04813. v m v mX X      = 26.8 – 26.7 = 0.1, 2 2 2 v mv m x xX X      = 0.06896 y v mX X   = 0.2626. Luego: 2 ( , )v mv m v m X X X X N        = N(0.1, 0.2626) y ( 0.1) 0.2626 v mX X Z     N(0, 1). Se pide: a) P( vX < mX ) = P( vX - mX < 0) = ( 0.1) 0 0.1 0.2626 0.2626 v mX X P         = = P(Z < -0.38) =  (-0.38) = 0.35197 Rpta. Interpretación.- en el 35.2% de las (ó en 3520 de cada 10000) muestras de 300 niños y 300 niñas peruanos de 9 años de edad, el peso promedio de los niños es menor que el peso promedio de las niñas. b)  0.6v mP X X  = 1 -  0.6v mP X X  = 1 - 0.1 0.6 0.1 0.2626 0.2626 v mX X P         = = 1 – P(Z < 1.90) = 1 -  (1.90) = = 1 – 0.97128 = 0.02872 Rpta. Interpretación.- en el 2.87% de las (ó en 287 de cada 10000) muestras de 300 niños y 300 niñas peruanos de 9 años de edad, el peso promedio de los niños será al menos 0.6 kg. más que el peso promedio de las niñas. 14. Una empresa azucarera embolsa azúcar con un contenido medio de 50 kg. y desviación estándar de 0.5 kg. Para el control de calidad se toman muestras
  • 65. 65 aleatorias de 25 bolsas de la producción diurna y 50 de la producción nocturna. Calcule e interprete la probabilidad de que la producción media de las bolsas de ambos turnos difieran en menos de 0.2 kg. Solución Los datos del problema son: μ1 = 50 Kg., σ1 = 0.5 Kg. y n1 = 25 bolsas. μ2 = 50 Kg., σ2 = 0.5 Kg. y n2 = 50 bolsas. Luego: 1 2 2 1 1 1 ( )X Var X n     = (0.5)2 / 25 = 0.01 y 2 2 2 2 2 2 ( )X Var X n     = (0.5)2 / 50 = 0.005 1 2 1 2X X      = 50 - 50 = 0, 1 21 2 2 2 2 x xX X      = 0.010 + 0.005 = 0.015 y A BX X   = 0.1225. Luego: 1 2 2 1 2 1 2( , )X X X X N        = N(0, 0.015) y 1 2( 0) 0.1225 X X Z     N(0, 1). Se pide:  1 2 0.2P X X  =  1 20.2 0.2P X X    = = 1 2 00.2 0 0.2 0 0.1225 0.1225 0.1225 X X P           = = P(-1.63 < Z < 1.63) = 2  (1.63) - 1 = = 2 (0.94845) – 1 = 0.8969 Rpta. Interpretación.- en el 89.69% de las (ó en 8969 de cada 10000) muestras de 25 bolsas de la producción diurna y 50 de la producción nocturna, la producción media de las bolsas de ambos turnos difieren en menos de 0.2 kg. 15. En las tiendas Metro el 70 % de las compras es en alimentos y bebidas. Si se seleccionan muestras aleatorias de 200 compras. Calcule e interprete: a) La probabilidad de que el porcentaje de compras en alimentos y bebidas sea mayor al 80%. b) ¿entre que límites simétricos alrededor del verdadero porcentaje de compras en alimentos y bebidas caerá el 99% de los porcentajes muestrales? Solución Los datos del problema son: P = 0.70 = proporción de las compras en alimentos y bebidas en las tiendas Metro, Q = 0.30, n = 200 compras = tamaño de la muestra.
  • 66. 66 Asumiendo un número muy grande de compradores, entonces, la proporción muestral: 1 , n i i X X PQ p N P n n n            = N(0.70; 0.00105) y 0.70 0.70 0.03240.00105 p P p p Z PQ n       ~ N(0, 1). Se pide calcular: a) P (p > 0.80 ) = 1 - P (p ≤ 0.80 ) = 1 - 0.70 0.80 0.70 0.0324 0.0324 p P        = 1 - P(Z  3.09) = 1 -  (3.09) = 1- 0.9990 = 0.0010 Rpta. Interpretación.- en el 0.10 % de las (ó en 10 de cada 10000) muestras de 200 compras en las tiendas Metro, el porcentaje de compras en alimentos y bebidas es mayor al 80%. b) Sean 0.70 – E y 0.70 + E los límites simétricos alrededor de la proporción verdadera P = 0.70, dentro de los cuales estará el 99 % de las p (proporciones muestrales). Entonces: 0.99 = P(0.70 – E  p  0.70 + E) = ( ) 0.0324 0.0324 E E P Z    = = 2 1 0.995 0.0324 0.0324 0.0324 0.0324 E E E E                                  0.995 2.575 2.575(0.0324) 0.083 0.0324 E Z E     . Luego los límites serán: 0.70 – E = 0.70 – 0.083 = 0.617 y 0.70 + 0.083 = 0.783. Es decir: 0.99 = P(0.617  p  0.783) Rpta. Interpretación.- en el 99% de las (ó en 9900 de cada 10000) muestras de 200 compras en las tiendas Metro, el porcentaje de compras en alimentos y bebidas se encuentra entre 61.7% y 78.3% alrededor de la proporción verdadera P = 0.70. 16. El 40% de los clientes de las tiendas Saga son varones. Si se toma una muestra aleatoria de 200 clientes. Calcule e interprete: a) La probabilidad que el porcentaje de clientes varones esté entre 36% y 45%.