Distribución muestral de la media

DISTRIBUCIÓN MUESTRAL
 Una distribución muestral es una distribución de
Probabilidad de una estadística muestral calculada a
partir de todas las muestras posibles de tamaño "n"
elegidas al azar de una población determinada.
 Generalmente nos interesa conocer una o más de
los siguientes características de la distribución
muestral.
 1.- Su forma funcional (como aparece en su
representación gráfica).
 2.- Su media.
 3.- Su desviación estándar (error estándar)

Esquema: Distribución muestral

DISTRIBUCIÓN MUESTRAL DE LA MEDIA ( X )
La distribución muestral de X es la distribución probabilística de todos los
valores posibles de X que pueden ocurrir cuando se seleccionan muestras
(de tamaño n) de alguna población original con media  y con varianza 2
.
Consideramos 2 casos:

10
. SI LA SELECCIÓN SE HACE CON REPOSICIÓN DE UNA POBLACIÓN FINITA O
EQUIVALENTEMENTE SIN REPOSICIÓN DE UNA POBLACIÓN INFINITA
Si X es la media muestral, entonces:
1) E X
( )  
2) Var X
n
( ) 
2
3) Para n suficientemente grande, la variable aleatoria.
n
X
Z
/



 N(0,1)
Lo que revela que: 
_
x < , además, 
_
x  0 cuando n  
 Para n 30 suficientemente grande, X N (  , 2/n ). Si X es contínua o discontínua
 Si X N (  , 2), entonces X N (  , 2/n ), para n > 2.
 X N (  , 2/n ), si el muestreo es con reemplazo de una población finita de tamaño N, o
sin reemplazo de una población infinita.

2º Si el muestreo es sin reemplazo en una
población finita de tamaño N.
2º. SI EL MUESTREO ES SIN REEMPLAZO EN UNA POBLACIÓN FINITA DE TAMAÑO N.
Entonces X tiene la siguiente distribución:
 E(
_
x ) =  ;

1
_



N
n
N
n
x


El coeficiente 







1
N
n
N se denomina factor de corrección para población finita (fcpf).
Cuando N >>n, el fcpf 1. Y debe obviarse en la fórmula anterior.
NOTA: Si n<<N ( Es decir (n/N)<0.1), entonces,
n
X
V
2
)
(



; fcpf, se obvia.
 La variable X
Z


 es N(0, 1)

Ejemplo. Distribución de media muestral
Consideremos una población hipotética de tamaño N=5. Cuyos valores son: Rx =  2, 4, 6, 8, 10  .
a. Calcular la media y la varianza de la población
b. Determinar la distribución de las medias de muestras de tamaño 2, seleccionadas al
azar con reposición.
c. Determinar la distribución de las medias de muestras de tamaño 2, seleccionadas al
azar sin reposición.
Solución
a. La distribución de probabilidad de esta población (X) finita de tamaño N = 5, es la
distribución uniforme :
Tabla 01
Xi 2 4 6 8 10
P(xi) = P(X=xi) 1/5 1/5 1/5 1/5 1/5
La media y la varianza de la población son respectivamente:





























N
N
i
i
i
i
N
i
N
i
i
i
N
i
i
i
N
x
x
f
x
N
x
N
x
x
f
x
2
2
2
2
2
2
2
1
2
2
2
2
1
1
1
8
6
5
10
8
6
4
2
)
(
6
5
10
8
6
4
2
)
(





b) Muestras seleccionadas con reposición
Se pueden extraer m= Nn
=52
= 25 muestras de tamaño dos con reposición.
Las muestras y sus medias correspondientes son las siguientes:
Tabla 02
1ª Unidad Muestral 2ª Unidad Muestral
2 4 6 8 10
2
4
6
8
10
2.2 2.4 2.6 2.8 2.10
(2) (3) (4) (5) (6)
4.2 4.4 4.6 4.8 4.10
(3) (4) (5) (6) (7)
6.2 6.4 6.6 6.8 6.10
(4) (5) (6) (7) (8)
8.2 8.4 8.6 8.8 8.10
(5) (6) (7) (8) (9)
10.2 10.4 10.6 10.8 10.10
(6) (7) (8) (9) (10)
Medias en ( X )
Aquí X tiene una media  = 6 y ² =8
Considerando todas las muestras posibles con reposición:
a) m = N
n
= 5² = 25

Cálculo de la media y varianza.
Cálculo de medias i
X : Ver tabla 02.
Tabla 01
X i
2 3 4 5 6 7 8 9 10 total
P(xi) 1/25 2/25 3/25 4/25 5/25 4/25 3/25 2/25 1/25 25/25
Para esta distribución de X , se tiene:
6
)
25
1
(
10
...
)
25
2
(
3
)
25
1
(
2
)
( 




 
x
X
E 


 )
(X
E
4
25
1
)
6
10
(
...
25
1
)
6
2
(
)
(
)
(
)
( 2











 i
x
i X
p
X
X
V 
Pero el valor de la varianza se puede calcular también mediante:
4
2
8
)
(
2




n
X
V

Constatándose que la fórmula Var X
n
( ) 
 2
, es correcta

distriuciondemedias
media frec.absol
2 1
3 2
4 3
5 4
6 5
7 4
8 3
9 2
10 1
0
1
2
3
4
5
6
0 2 4 6 8 10 12
frec.absoluta
valorde la media
Forma funcional empírica

2º. Si el muestreo es sin reemplazo en una población finita de tamaño N.
(m = NCn )
Entonces la media y la desviación estándar (error estándar) de la variable X son:
 E(
_
x ) =  ;

1
_



N
n
N
n
x



El coeficiente 







1
N
n
N se denomina factor de corrección para población finita (fcpf).
NOTA: Si el tamaño de muestra es pequeño en relación con el de la población digamos: [(n/N)< 0.05) ],
entonces, el f.cp.f tiende a 1 y se puede obviaren la fórmula anterior.
n
X
V
2
)
(



da resultados
correctos aún en el caso de muestreo sin reposición.

DISTRIBUCIÓN MUESTRAL De CUANDO LA
POBLACIÓN ES NORMAL (σ es conocida)
X
Si la población madre (Xi ) se distribuye normalmente con media  y varianza
2
 , entonces la distribución de X cualquiera que sea su tamaño es también
normal con:
a) E X
( )  
b) Var X
n
( ) 
 2
c) La variable aleatoria.
n
X
Z
/



 N(0,1)
x x

X X

EJEMPLO: Sea X  N (  = 50,
2
 = 80 ) si se extraen todas las muestras posibles de tamaño n = 20, de esta población.
Entonces la distribución muestral de la media X , será: N ( 50, 80/20 = 4 ) . Hallar:
1) P( X > 48)
2) P(48< X < 54)
3) Cuál es el valor de la media arriba del cual se incluye el 20% de valores más altos?
SOLUCIÓN
1). P( X > 48) = P(( X -µ)/( n
/
 ) > (48 -50)/(80/20)0.5
)
= P(Z>-1.00)= 0.84134 44 46 48 50 52 54 56 X
Donde:
X =z( _
x
 )+µ
-3 -2 -1 0 1 2 3 Z
donde Z=( X -µ)/ _
x

2). P(48< X < 54)= P( (48-50)/2 < Z<(54-50)/2)= P(-1.00 < Z < 2.00)
=P(Z< 2.00)- P(Z<-1.00)
= 0.97725 – 0.15866
=0.81859
=81.86%
3). P(Z>z )= 0.2000
Donde z= 0.84162, entonces X =z( _
x
 )+µ = (0.84162)(2)+50
= 68.52.

EJEMPLO.
Una empresa eléctrica fabrica focos que tienen una duración que se distribuye aproximadamente en forma
normal, con media de 800 horas y desviación estándar de 40 horas. Encuentre la probabilidad de que una
muestra aleatoria de 16 focos tenga una vida promedio de menos de 775 horas
SOLUCIÓN
Sea X es N(800h, 40h, entonces X es N(800h y 10h)
Muestra n=16 focos
P( X < 775) = P(Z< (775-800)/10)= P(Z< -2.5) = 0.00621

DISTRIBUCIÓN MUESTRAL DE X CUANDO “ 2
 ” ES CONOCIDA Y SE
DESCONOCE LA DISTRIBUCIÓN DE LA POBLACIÓN
A. DISTRIBUCIÓN MUESTRAL DE X CUANDO “
2
 ” ES CONOCIDA Y SE DESCONOCE LA
DISTRIBUCIÓN DE LA POBLACIÓN,
Independientemente de la distribución que tenga la población Original (siempre que tenga una media finita
 y varianza
2
 ), la distribución X N (  , 2
/n ), cuando n  . y su distribución
muestral tiene:
a) E X
( )  
b) Var X
n
( ) 
 2
c) La variable aleatoria.
n
X
Z
/



 N(0,1), para n ≥30
NOTA: 1/ no se requiere ninguna suposición acerca de la normalidad de la población original cuando n es
grande (n≥ 30).
NOTA. SI LA POBLACIÓN ES FINITA DE TAMAÑO (N), EL ERROR ESTÁNDAR DE LA MEDIA ES
1
_



N
n
N
n
x



Ejemplo.Lamediadelaprecipitación enunacuencahidrometeorológicatieneunpromediode
3.5in. yunadesviaciónestándarde0.18in¿Cuáleslaprobabilidaddeque enunamuestraaleatoria
de100observacionestomadasdeesacuenca,la media estéentre3.53 y3.56 in?
Solución
X Noes N(3.5,0.18),
X N(3.5, 0.018)
Comoelerror estándar delamedia muestrales: _
x
 = 0.018
P( 3.53 ≤ X ≤ 3.56)=P(1.67≤Z≤3.33)=0.0471

EJEMPLO. Unciertoenvíode barras de hierrodiolas siguientesresistencias a lafractura en una m.a. de tamaño
30 (en kg.):
xi = {1525, 1516, 1542, 1600,1590, 1553, 1530, 1585, 1570, 1545, 1548, 1570, 1595, 1531, 1542, 1555,
1567, 1539, 1541, 1550, 1558,1547,1562, 1570, 1554, 1528,1523, 1530, 1535,1529}
a. Estimar la media y la desviación estándar de la resistencia a la fractura.
b. Calcular la probabilidad de que la R promedio a la Fractura del fierro sea inferior a 1548 kg.
Solución
a. Ingresamos los datos a minitab.
X =1551 kg
S = 22.2 kg
b. P( X < 1548 )
P(Z<(1548-1551)/(22.2/30^0.5)) =P(Z<-0.7407)= 0.2294

DISTRIBUCIÓN DE LA MEDIA MUESTRAL CUANDO [2 ES DESCONOCIDA]
Se consideran 3 casos:
1. Si la población madre no es normal y “n” es pequeña.
Este caso no puede resolverse.
2. Si la población no es normal, pero “n” es grande.
Cuando n ≥ 30, x sigue una distribución t-Student con n-1 g.l, es decir:
x - x
------------ t(n-1)
S/n
3. Si la población es normal.
- Si n < 30, x sigue una distribución t- Student , es decir:
x -  x
------------ t(n-1)
S/n
- Si n  30, entonces :
x -  x
------------ N( 0, 1)
S/n

Ejemplo
La tabla siguiente muestra los datos relativos a la tormenta, las precipitaciones y escorrentía sobre
un rio determinado
Tormenta Precipitación ( pulgadas) escorrentiaa (pulgadas)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
1.11
1.17
1.79
5.62
1.13
1.54
3.19
1.73
2.09
2.75
1.20
1.01
1.64
1.57
1.54
2.09
3.54
1.17
1.15
2.57
3.57
5.11
1.52
2.93
1.16
0.52
0.40
0.97
2.92
0.17
0.19
0.76
0.66
0.78
1.24
0.39
0.30
0.70
0.77
0.59
0.95
1.02
0.39
0.23
0.45
1.59
1.74
0.56
1.12
0.64

a. Calcular la media, desviación estándar para la precipitación y
escorrentía
b. Determine la distribución muestral de la media para la
precipitación y escorrentía.
c. Calcular la probabilidad que la media muestral de la
precipitación sea mayor que 2.25
Solución
a) Para la precipitación
Media muestral = 53.89/25 = 2.16 in.
Varianza muestral = 1/24 (153.9 – 25(2.16)2) = 1.53
D.E = 1.24 in.
Error estándar de la media = 0.25
Para la Escorrentía
Media muestral = 20.05/25 = 0.80 in.
Varianza muestral = 1/24( 24.68 – 25(0.80)2) = 0.36
D,E = 0.60 in.
Error estándar de la media = 0.60/5 = 0.12

X
Determine la distribución muestral de la media para la precipitación y escorrentía
Para la precipitación:
a) E X
( )    2.16
b)Var X
n
( ) 
 2

1.53
25
= 0.36 in2
c) X t24 (t-Student con 24 gl)
Para la Escorrentía:
a) E X
( )    0.80 in
b)Var X
n
( ) 
 2

0.36
25
= 0.0144 in2
c) X t24 (t-Student con 24 gl)
Calcular la probabilidad que la media muestral de la precipitación sea mayor que 2.25
P( X > 2.25) = P(( X -µ)/(s/n)>(2.25-2.16)/(1.24/5))
= P(T> 0.36)= 0.36100=36.10%

Distribución muestral de una proporción

Distribución muestral de una proporción
La distribución muestral de “p”, o proporción muestral, calculada con base en muestras
aleatorias simples de tamaño “n” sacadas de una población en la que la proporción
poblacional es “P”, está distribuida en forma normal si “n≥ 30”;
a) P
p
E 
)
(
b)
n
P
P
p
V
)
1
(
)
(

 
c) Si n es grande, entonces la variable:
n
P
P
P
p
Z
)
1
( 

 N(0,1)
 Si la población es finita de tamaño “N”, la distribución de “p” tendrá:
a) P
p
E 
)
(
b) 









1
)
1
(
)
(
N
n
N
n
P
P
p
V ; Donde 







1
N
n
N
=factor de corrección por población finita.
c) Si n/N  0.05, el f.cp.f se obvia y la variable:
n
P
P
P
p
Z
)
1
( 

 N(0,1)

Ejemplo
BelLabs adquiere componentes para sus teléfonos celulares en lotes de
200 de una firma determinada. El componente tiene una tasa de
defectos del 10%. Una política establecida recientemente por BelLabs
establece que si el siguiente envío tiene:
a. Más del 12% de defectos, definitivamente buscará un nuevo
proveedor.
b. Entre el 10 y el 12% de defectos, considerará un nuevo proveedor.
c. Entre el 5 y el 10% de defectos, definitivamente no conseguirá un
nuevo proveedor.
d. Menos del 5% de defectos, incrementará sus pedidos.
¿Cuál decisión es más probable que tome BelLabs?
Solución
Debido a que el tamaño de la población N no se suministra, se
asume que BelLabs compra muchos componentes y el tamaño de la
muestra de n = 200 es menor que 0.05N y por tanto el fcpf no se
tiene en cuenta

INTERPRETACIÓN:
Como la parte c tiene la probabilidad más alta, BelLabs se quedará con su proveedor actual

Supongamos que el 30 % de la población de
viviendas de un país tienen más de un cuarto de
aseo. Con el fin de obtener una información más
precisa se toma una muestra aleatona de tamaño 400
viviendas. Obtener:
1." La probabilidad de que la proporción de viviendas
de la muestra con más de un cuarto de aseo esté
comprendida entre 0,25 y 0,32.
2." La probabilidad de que el porcentaje de
viviendas de la muestra con más de un CUARTO de
aseo sea superior al 33 %.
EJEMPLO

Ejemplo
En una remesa de vacunas, 30% son defectuosos. Si se extrae una muestra al azar de 500, con
reposición, de esta población. ¿ Cuál es la probabilidad de que la proporción muestral sea menor que 0.3
?.
Solución
Una distribución muestral que es normal la definen completamente su esperanza y su varianza. Aquí la
muestra es suficientemente grande para que la distribución de “p” sea aproximada por la normal.
Para la distribución de “p” con n = 500, tenemos:
E(p) = P = 0.3
n
P
P
p
)
1
( 

 =
500
)
3
.
0
1
(
3
.
0 
= 0.025
Teniendo en cuenta que: fcc = 1/2n = 1/1000 = 0.001; fcc= factor de corrección por
continuidad, ya que estamos aproximando la binomial mediante la normal.
La probabilidad pedida será:
P(p  0.3 )  P ( Z  (0.3+1/2n –0.3)/0.025) = P( Z  0.05 ) = 0.5199

DISTRIBUCION MUESTRAL DE LA DIFERENCIA DE
DE DOS MEDIAS MUESTRALES ( MUESTRAS
INDEPENDIENTES)

DISTRIBUCIÓN MUESTRAL DE LA DIFERENCIA DE DOS
MEDIAS CON VARIANZAS POBLACIONALES CONOCIDAS)
Supongamos que se tienen dos poblaciones con medias y varianzas definidas en los esquemas:
Población 1 Población 2
X1: Media =1 X2 : Media = 2
Varianza = 
2
1 Varianza = 
2
2
Muestra (n1): x11, x21, x31, . . ., xn1 Muestra (n2): x12, x22, x32, . . ., xn2
Media muestral = X 1 Media muestral = X 2
Entonces, la estadística X 1 - X 2 tiene las siguientes propiedades:
a) 2
1
2
1


 

X
X
b)
2
2
2
1
2
1
2
2
1
n
n
X
X


 


c) Para n1 y n2 suficientemente grandes, la variable aleatoria:
Z
X X
n n

  

1 2 1 2
1
2
1
2
2
2
( )
 
 
N (0,1)

EJEMPLO: Se han extraído dos muestras aleatorias de tamaño n de dos
máquinas que embolsan automáticamente un mismo producto cuya
característicamedibleeselpesoengramos.Sesabeque lospesosde
los productos de cada máquina se distribuyen normalmente con
medias respectivas iguales a 120 gramos y con varianzas respectivas
iguales a 18 gramos2
. Encontrar el valor de n de manera que la
probabilidad de que las medias muestrales difieran en menos de 2
gramos se 0.95.

SOLUCIÓN
Sean X 1 y X 2 las medias de los pesos de las muestras respectivas. Los pesos de las poblaciones se
distribuyen normalmente con medias iguales y varianzas iguales. Entonces, la diferencia de las dos media
muestrales X 1 - X 2 tiene distribución normal, esto es: N
n n
 
 
1 2
1
2
1
2
2
2
 






,
siendo 1 - 2 = 0, y la varianza sería:
 
1
2
1
2
2
2
18 18 36
n n n n
 


Luego, la variable estándar: Z
X X
n

 
1 2 0
36/
N(0,1)
Se debe hallar el valor de n tal que:
 
P X X
1 2 2 095
   . , entonces,
  )
5
.
0
)
3
(
(
2
3
3
/
36
0
2
2
95
.
0 2
1 

























 





n
Z
p
n
Z
n
P
n
Z
P
X
X
P
de donde resulta,
35
57
.
34
,
88
.
5
,
96
.
1
3
,
975
.
0
)
3
( 












 n
n
n
n
Z
p

EJEMPLO
Se prueba el rendimiento en km/L de 2 tipos de gasolina,
encontrándose una desviación estándar de 1.23km/L para la
primera gasolina y una desviación estándar de 1.37km/L para
la segunda gasolina; se prueba la primera gasolina en 35
autos y la segunda en 42 autos. ¿Cuál es la probabilidad de
que la primera gasolina de un rendimiento promedio mayor de
0.45km/L que la segunda gasolina?
SOLUCION
 Datos:
 1 = 1.23 Km/Lto
 2 = 1.37 Km/Lto
 n1 = 35 autos
 n2 = 42 autos

DISTRIBUCIÓN MUESTRAL DE LA DIFERENCIA DE DOS
MEDIAS CON (VARIANZAS POBLACIONALES DESCONOCIDAS)
Supongamosquesetienendospoblacionescon parámetrosdefinidoscomosigue:
Población 1 Población 2
X1: Media=1 X2:Media=2
Varianza=
2
1 (Desconocida) Varianza=
2
2 (Desconocida)
Muestra(n1):x11,x21,x31,...,xn1 Muestra(n2):x12,x22,x32,...,xn2
Mediamuestral= X1 Mediamuestral= X2
Varianzamuestral=
2
1
S Varianzamuestral=
2
2
S

varianzas poblacionales desconocidas
A. MUESTRAS GRANDES: n1, n2 ≥ 30.
En este caso la estadística X 1 - X 2 , (diferencia de medias muestrales) se distribuye aproximadamente
Como una normal con 2
1 
  , y varianza
2
2
2
1
2
1
n
S
n
S

. MUESTRAS PEQUEÑAS: n1, n2 < 30.
B.1 Varianzas poblacionales desconocidas pero supuestas iguales: 2 =
2
2
2
1 
 
En este caso, la estadística:


















2
1
2
1
2
2
2
2
1
1
2
1
2
1
1
1
2
ˆ
)
1
(
ˆ
)
1
(
)
(
)
(
n
n
n
n
S
n
S
n
X
X
Tc

 t(n1+n2 – 2)
Tiene distribución t- student con n1+n2-2 grados de libertad.

Ejemplo:
Suponga que dos máquinas A y B, producen
independientemente el mismo tipo de probetas y que el
tiempo que cada una emplea en producirlos se distribuye
normalmente con varianzas respectivas y desconocidas.
Se han tomado dos muestras aleatorias, una de A y otra de
B, obteniéndose los siguientes tiempos en minutos:
Muestra de A: 17, 23, 21, 18, 22, 20, 21, 19
Muestra de B: 13, 16, 14, 12, 15, 14
Determinar la distribución muestral de la diferencia de
medias, asumiendo que las varianzas son desconocidas
pero iguales.
Calcular la probabilidad de que la media de la primera
máquina sea mayor que la de la segunda máquina
Solución

a- X(tiempoproducción)máquinaAN(μ1, 2
1
 )n1 = 8
Y(tiempoproducción)máquinaBN(μ2, 2
2
 )n2 = 6
g.l. =n1 +n2 -2=12;
delamuestra:
2
1

S =4.13y X 1 = 20.125
2
2

S =2.0 y X 2 = 14.00
2
1 X
X 
 = 













2
1
2
1
2
2
2
2
1
1 1
1
2
ˆ
)
1
(
ˆ
)
1
(
n
n
n
n
S
n
S
n
= 







6
1
8
1
12
0
.
2
*
5
13
.
4
*
7
= 0.9725
B. P[( 2
1 
  )>0]= P(( X 1 - X 2 )-( 2
1 
  )< (( X 1 - X 2 ))
= P[ ( (( X 1 - X 2 )-( 2
1 
  ))/ 2
1 X
X 
 < (( X 1 - X 2 )/ 2
1 X
X 
 ]
= P( T< (( X 1 - X 2 )/ 2
1 X
X 
 )= P(T<(20.125- 14.000)/0.9725)
= P(T<6.30) = 0.99998

Varianzas desconocidas supuestas desiguales
B.2.Varianzaspoblacionalesdiferentes: 1
2
2
2
Enestecaso,lavariablealeatoria:
T
X X
S
n
S
n

  

( ) ( )
 
1 2 1 2
1
2
1
2
2
2
  tg;donde
2
1
ˆ
1
ˆ
ˆ
ˆ
2
2
2
2
2
2
1
1
2
1
2
2
2
2
1
2
1
























n
n
S
n
n
S
n
S
n
S
g
Signoesenteroseredondeaalenterosuperiormáscercano

Ejemplo.
Una empresa fabrica un mismo producto en 2 máquinas.
Una muestra aleatoria de 9 productos de la máquina uno,
ha dado los siguientes tiempos de fabricación en segundos:
X1: 12, 28, 10, 25, 24, 19, 22, 33, 17;
mientras que una muestra aleatoria de 8 productos de la
máquina dos:
X2: 16, 20, 16, 20, 16, 17, 15, 21.
Asumir que las dos poblaciones son normales con
varianzas diferentes pero desconocidas.
a. Hallar la distribución de probabilidades de
b. Calcular la probabilidad de que la máquina uno presenta
un tiempo promedio mayor que la máquina dos.
Solución
X 1- X 2 =  x

Sean X1 y X2 las v.a que representan los tiempos empleados por las máquinas uno y dos,
Respectivamente
De las muestras dadas obtenemos:
a) X1: n1 = 9, x1 = 21.111, S1 = 7.4237
b) X2: n2 = 8, x2 = 17.625, S2 = 2.326
X 1- X 2 =  x, tiene:   x = 1 - 2;  x =  [(7.4237)2 /9 + (2.326)2 /8 ] = 2.6
[ x -  ] /  x = T  T ( t- Student con  grados de libertad ); donde.
[(7.4237)2 /9 + (2.326)2 /8 ] 2
 = --------------------------------------------------- - 2 = 10.17  11
[(7.4237 /9)2 /10 + (2.326 /8)2 /9 ]
P[1 > 2 ] = P [1 - 2 > 0 ] = P [( X 1- X 2 - (1 - 2) ) /  x ] > ( X 1- X 2 )/  x 
= P [ T11 >(-3.486)/2.6 ] = P(T> -1.34) = 0.8964
Solución

EJEMPLO. A fin de mejorar el rendimiento, se está utilizando un proceso químico. Por el
momento se está utilizando el catalizador 1, pero un nuevo catalizador 2 es aceptable. Se
realiza un experimento en la planta piloto, empleando para el catalizador 1 n1= 8 ensayos y n2
= 8 para el catalizador 2. Las medias y varianzas muestrales observadas son X 1 = 91.73 ,
S1
2 = 3.89; X 2 = 93.75 y S2
2 = 4.02
a) Determinar la distribución muestral de x
b) Asumiendo que las varianzas poblacionales son desconocidas pero iguales. Presentan los
datos suficiente evidencia para indicar que el uso del catalizador 2 mejora el rendimiento
promedio 
Solución
a) x = X 1- X 2, tiene una distribución t-Student con (n1+n2 – 2), es decir:


















2
1
2
1
2
2
2
2
1
1
2
1
2
1
1
1
2
ˆ
)
1
(
ˆ
)
1
(
)
(
)
(
n
n
n
n
S
n
S
n
X
X
T


2
2
1
ˆ
)
1
2
(
ˆ
)
1
1
( 2
2
2
1
2






n
n
s
n
s
n
Sc
, se denomina varianza combinada, y estima a 2=
2
2
2
1 
 
Sustituyendo datos, se tiene: S 96
.
3
2

c , )
( 2
1 x
x 
 = 0.995 (error estándar de la  x)

b)Para dar respuesta a la proposición (b), se calcula p(2  1).
p(2  1) = p(1 - 2< 0 ) = p(-(2 - 1)< 0) = p [( X 2-X 1)- (2 - 1) < (X 2-X 1)]
p [(( X 2-X 1)- (2 - 1))/ Sc< 2.02/0.995] = P( T < 2.03) = 0.9691

Distribución Muestral de Diferencia de Proporciones

Distribución Muestral de Diferencia de 2 Proporciones
La distribución muestral de p1 – p2, o diferencia entre dos
Proporciones muestrales, calculadas a partir de muestras aleatorias e
independientes de tamaño n1 y n2 extraídas en forma aleatoria de 02
poblaciones con parámetros P1 y P2; tiene como:
2
1 p
p 
 = P1 – P2
2
2
2
1
1
1 )
1
(
)
1
(
2
1
n
p
p
n
p
p
p
p






Si n1 y n2 son grandes la distribución muestral de p1 - p2 se aproxima
a una distribución normal

EJEMPLO
Se sabe que 10% de los artículos producidos por la Industria A son defectuosos, y que 5% de los producidos por
la compañía B son defectuosos. Una muestra al azar de 250 unidades tomada de la línea de producción de la
Industria A, se encuentra que 20 son defectuosos; una muestra al azar de 300 unidades es tomada de la línea
de producción de la Industria B, se encuentra que 18 son defectuosos. ¿Cuál es la probabilidad de obtener esta
diferencia o una menor en proporciones de muestra si el supuesto acerca de los parámetros poblacionales es
correcta?
solución
Si el supuesto fuera correcto, la distribución de p sería definida por:
p = 0.1-0.05 = 0.05
σp = [(0.1)(0.9)/(250)+(0.95)(0.05)/(300)] = 0.0228
La probabilidad deseada será:
P(p  0.02) P(Z(0.02- 0.05)/0.0228)
= P(Z -1.32) = 0.0934

EJEMPLO: El Ingeniero de control de calidad de una industria
opina que el 15% de la producción de la línea de producción A y
el 10% de la línea de producción B no cumplen con las
especificaciones normales de dulzura. En una muestra aleatoria
simple de 150 artículos de la línea de producción A se encontró
que 30 tenían ese problema. Una muestra aleatoria simple e
independiente de 100 artículos de la línea de producción B reveló
que 07 estaban fuera del rango normal.
Asumiendo que la evaluación del control de calidad es correcto.
¿ Cuál es la probabilidad de encontrar una diferencia entre las
proporciones muestrales mayor o igual a la que realmente se

Solución.
Como n1 = 150 y n2 = 100 son grandes  P1 - P2  normal
aproximadamente.
05
.
0
10
.
0
15
.
0
2
1



 p
p

04
.
0
100
)
90
.
0
)(
10
.
0
(
150
)
85
.
0
)(
15
.
0
(
2
1



 p
p

Si el control es correcto, las proporciones muestrales observadas son:
P1 = 30 / 150 = 0.20 P2 = 7 / 100 = 0.07
Deseamos conocer la probabilidad de observar una diferencia mayor o
igual a:
P1 - P2 = 0.20 - 0.07 = 0.13
Para hallar esta probabilidad calculamos:







 







 04
.
0
05
.
0
13
.
0
)
(
)
(
)
13
.
0
(
2
2
2
1
2
1
2
1
p
p
P
P
p
p
p
p
p
p

  4772
.
0
5
.
0
0
.
2 


 Z
p 0228
.
0
 %
28
.
2


DISTRIBUCIÓN MUESTRAL DE: [ (n-1)S2 /2 ]
Sea S2 la varianza de la muestra x1, x2, …, xn. Escogida de una población descrita por
una variable aleatoria X de media  y varianza 2 , entonces
a) E(S2) = 2
b) [(n-1)S2
/2
] 2
(n-1) , siempre que X N( , 2 )
Ejemplo . De una población X normal N(100 , 4 ) se obtiene una muestra aleatoria de tamaño 15.
a) Calcule la P(1.3316< S2 < 8.3256)
b) Halle el intervalo [a,b] , tal que P(a< S2 < b) = 0.95, P(S2 <a) = 0.025
Solución
a). P(14*0.3329 < 14 S2/ 2 < 14* 2.0814) = P [ 4.66 < 2
(14) < 29.14) =0.99- 0.01 = 0.98
b). Primero hallamos P(14*S2/2 < (14/4)a)= P(2
(14)< 3.5 a)=0.025; a=(5,62878/3.5) = 1.6
P(1.6<S2
<b) = 0.95
P( 5,6 < 2
(n-1) <3.5 b)=0.95
P(2
(n-1)<3,5 b) – p(2
(n-1) <5.6) =0.95
P( (2
(n-1)<3,5 b)= 0.95 + p(2
(n-1) <5.6)
= 0.95+0.02441

Chi- cuadrado
1 -
x
/ 2
f (x )
X2
α/2, n-1 X2
1-α/2, n-1
α/2
Usamos esta función para determinar un intervalo de confianza (1– α)% para σ².

Si S1
2 y S2
2 son las varianzas de dos muestras aleatorias independientes de tamaños n1 y
n2 seleccionadas de dos poblaciones normales N(1, 1
2 ) y N(2, 2
2) respectivas, entonces,
la variable aleatoria
S1
2/ 1
2
F = -------------- F(n1-1, n2-1)
S2
2 /2
2
Tiene una distribución F con n1- 1, n2-1 grados de libertad, esto es F F 1-α, (n1- 1, n2-1).
Observación Si 1
2
= 2
2 , entonces F = S1
2/ S2
2 se distribuye según F con n1- 1, n2-1
grados de libertad.
Ejemplo. De poblaciones N(1, 1
2
) y N(2, 2
2
) independientes se extraen dos muestras de
tamaños 13 y 21 respectivamente. Halle el valor de k tal que :
a) P(S1
2
< k S2
2
) = 0.99
b) P( S1
2
/ S2
2
< k)= 0.05
DISTRIBUCIÓN MUESTRAL DE LA RAZON ( S1
2/ S2
2)

Solución
a) P(S1
2 < k S2
2 ) = 0.99, significa que P(F<k ) = 0.99, donde F = S1
2/ S2
2  F(12, 20),
entonces a partir de la tabla F para 12, 20 gl, se tiene que: K= 3.23
b) P(S1
2
/ S2
2
<k) = 0.05, implica que P(F<k) = 0.05, donde F = S1
2
/ S2
2

F0.05(12, 20), entonces K = F0.05(12, 20)= 1/ F0.95, 20,12 = ½.54. = 0.394
Ejemplo.
Si dos muestras aleatorias independientes de tamaños n1=7 y n2= 13, se toman de una
población normal, ¿ Cuál es la probabilidad de que la varianza de la primera sea al menos 3
veces más grande que la de la segunda .
Solución.
En la tabla F hallamos que F0.05 es 3.0 para 1 = 6 y 2 = 12. Por tanto la probabilidad
deseada es:
P[S1
2/ S2
2  3/1] = P [ F0.05,6,12  3.0 ] = 0.05
= P(F0.95, 6,12 <3,0) =0.95
Ejemplo. Encuéntrese la probabilidad de F0.95 (correspondiente a la probabilidad de cola
izquierda de 0.05) para 1 = 10 y 2 = 20. grados de libertad.
Solución
Usando la identidad:
F(1, 2 ) = 1/ F1-(2, 1 ).
Obtenemos:
F0.05 (10, 20) = 1/ F0.95 (20, 10) = 1/ 2.77 = 0.36

2
1
2 ,
, 


F 2
1
2
1 ,
, V
V
F 

1 -
x
/ 2
f (x )
Fig. Intervalo de confianza de
F de Snédecor
2
2
2
1


F/2(1, 2 ) F1-α(1, 2 )
/2

EJEMPLO
Si dos muestras aleatorias independientes de tamaños n1=7 y n2= 13, se toman de una población
normal, ¿ Cuál es la probabilidad de que la varianza de la primera sea al menos 3 veces más grande que
la de la segunda .
Solución.
En este caso tendremos Fv1, v2 para 1 = n1-1 = 6 y 2 = n2-1= 12.
Por tanto la probabilidad deseada es:
P[S1
2/ S2
2 = Fv1,v2  3/1] = P [ F0.05,6,12  3.0 ] = 0.05
P[S1
2/ S2
2 = Fv1,v2 ≤ 3/1] = P [ F0.95,6,12 ≤ 3.0 ] = 0.95
Ejemplo. Encuéntrese la probabilidad de F0.05 (correspondiente a la probabilidad de cola izquierda de
0.05) para 1 = 10 y 2 = 20. grados de libertad.
Solución
Usando la identidad:
F(1, 2 ) = F0.05(10,20)= 0.36
DISTRIBUCIÓN F – SNEDECOR.
Usaremos Aplicaciones para Android o software estadístico a fin de calcular áreas o percentiles
Bajo la curva F- Snédecor.
P[ F  F1-,(1, 2 ) ] = 1- 

Distribución muestral de la media

Recomendados

Recomendados

Más contenido relacionado

Similar a Distribución muestral de la media

Similar a Distribución muestral de la media (20)

Más de gloria Esparraga

Más de gloria Esparraga (7)

Último

Último (20)

Distribución muestral de la media