2. 10.1 Introducción
La estadística se divide en DESCRIPTIVA e
INFERENCIAL
ESTADISTICA
Prueba de
Hipótesis
DESCRIPTIVA
INFERENCIAL
Estimación
3. CONCEPTOS PRELIMINARES
Un estimador. Es una función de los valores
muestrales utilizada para estimar un
parámetro de población.
Una Estimación. Cuando hemos observado
un valor numérico específico de nuestro
estimador, nos referimos a ese valor como
una estimación.
n
Xi
X
n
1
;mediamuestral (estimador)
10
10
1
xi
x
= (34700/10) = 3470 horas/ componente. ( Estimación).
4. 10.1.1 Tipos de estimaciones
A) Estimación puntual
Un sólo número se utiliza para estimar un
parámetro desconocido. Para ser útil debe de
estar acompañado del error.
Ejemplo:
Para el próximo mes se espera que las
precipitaciones sean 2.65 pulgadas con un error
de 10%.
5. Las estimaciones puntuales
(A) De la media poblacional
La media muestral estima a la media poblacional m
(B) De la varianza y la desviación estándar
S2 estima s2
S estima s
(C) De la proporción poblacional
p P
x
estima
6. BASE DE DATOS
Tormenta Precipitación ( pulgadas) escorrentiaa (pulgadas)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
1.11
1.17
1.79
5.62
1.13
1.54
3.19
1.73
2.09
2.75
1.20
1.01
1.64
1.57
1.54
2.09
3.54
1.17
1.15
2.57
3.57
5.11
1.52
2.93
1.16
0.52
0.40
0.97
2.92
0.17
0.19
0.76
0.66
0.78
1.24
0.39
0.30
0.70
0.77
0.59
0.95
1.02
0.39
0.23
0.45
1.59
1.74
0.56
1.12
0.64
La tabla siguiente muestra los datos relativos a la tormenta, las precipitaciones y
escorrentía sobre un rio determinado.
7. ESTIMACIONESPUNTUALES DE µ, s2 , P,
Variable n Media D.E. Var(n) E.E. Mín Máx Mediana
PRECIPITACIÓN 25 2.16 1.25 1.49 0.25 1.01 5.62
1.64
8. EJEMPLO
La siguiente tabla proporciona datos sobre la precipitación total registrada en 11 estaciones
meteorológicas de dos provincias de la región Cajamarca:
Prov. A: 100 90 85 120 130 105 65 70 90 108 130 (mm)
Prov. B: 120 110 95 115 140 120 70 90 108 130 132 (mm)
a) Dar una estimación puntual de máxima verosimilitud para los parámetros: media y
varianza para cada provincia. Asuma que las poblaciones tienen distribución normal.
b) Dar una estimación de la diferencia de medias y cociente de varianzas de las
precipitaciones en ambas provincias
Solución
9. PROPIEDADES DE LOS ESTIMADORES
3.
EFICIENCIA . Se dice que qˆ 1 y qˆ 2 dos estimadores insesgados de q, qˆ 1 es más
eficiente que qˆ 2 si qˆ 1 tiene menor v arianza que qˆ 2, si:
Ejemplo . Se determina la eficiencia relativa de 2 estimadores de la media poblacional :
e
M
x
2
1
ˆ
ˆ q
q
n
x
V
2
)
(
s
,
n
M
V e
2
)
(
2
ps
ER = V(Me)/V( )
x = 1.57. Por tanto la media es más eficiente
que la mediana al estimar a
m.
( ) ( )
2
1
ˆ
ˆ q
q Var
Var
2. CONSIST ENCIA. Se dice que un estimador es consistente si proporciona
estimaciones que convergen en probabilidad hacia el parámetro poblacional que se
está estudiando a medida que “n” crece. Es decir:
Ejemplo . La media es un estimador consistente de m, según la l ey de los grandes
números.
( ) 1
ˆ
lim
-
e
q
q
P
n
1. INSESGABILIDAD. Se dice que qˆ es un estimador insesgado de q, si el valor
esperado de qˆ es igual a q. Es decir:
E (qˆ ) = q
Ejemplo. La media muestral x , es un estimador insesgado de m .
10. TIPOS DE ESTIMACIÓN
Podemos hacer dos tipos de estimaciones concernientes a una población:
Estimación puntual: un solo número que se utiliza para estimar un
parámetro de población desconocido
Estimación por intervalo: intervalo de valores utilizado para estimar un
parámetro de población desconocido. Los extremos se calcula a partir de la
muestra con cierto margen de confiabilidad.
SUFICIENCIA. qˆ , un estimador de q es suficiente, si usa toda la
información contenida en la muestra.
Ejemplo. La media muestral es un estimador suficiente de la media
poblacional (varianza conocida).
11. Entre los principales métodos de estimación puntual se tiene:
1). El método de los momentos (en el que se iguala los
correspondientes momentos poblacionales y
muestrales).
2. El método de máxima verosimilitud (que busca
maximizar la probabilidad de que ocurra la muestra
observada)
3. El método de Mínimos cuadrados ordinarios
MÉTODOS DE ESTIMACIÓN PUNTUAL
12. MÉTODO DE LOS MOMENTOS
Supongamos que X es una variable aleatoria continua con densidad de probabilidad
f(x; Θ1, Θ2, ... , Θk) o una variable aleatoria discreta con distribución p(x; Θ1, Θ2, ... , Θk)
caracterizada por K parámetros desconocidos. Sea X1, X2, ... , Xn una muestra aleatoria
de tamaño "n" obtenida de X.
y defínase los k momentos muestrales con respecto al origen como:
n
x
m
n
t
i
t
1
'
; t = 1, 2, .... , k
Los primeros k momentos de la población con respecto a origen son:
μt' = E(Xt
) =
t
x f(x; Θ1, Θ2, ... , Θk)dx; t:1,k; v. continua
= ΣXt
p(x; Θ1, Θ2, ... ,Θk); t = 1, 2, .... , k; v. discrete
Los momentos de la población {μt'} serán en general funciones de los k parámetros
desconocidos {Θi}. Igualando los momentos muestrales y los momentos de la población
se obtendrá k ecuaciones simultáneas con k incógnitas (a los {Θi}); esto es:
μt' = mt' : t = 1, 2, .... , k ; (*)
La solución de la ecuación (*) es: qˆ 1, qˆ 2, ... , qˆ k y representa las estimaciones de
momentos de Θ1, Θ2, ... , Θk.
13. Ejemplo :
Sea X ───>N(μ,σ²) en donde μ y σ² son desconocidas. Para obtener estimadores
para μ y σ² mediante el método de momentos, recuérdese que para la distribución normal:
Los momentos poblacionales son:
μ1' = μ y μ2' = σ² + μ²
Los momentos de la muestra son:
m1' = (ΣXi )/n m2' = (ΣXi² )/n
A partir de la ecuación (*), se obtiene:
μ = (ΣXi )/n, σ² + μ² = ( ΣXi² )/n
Las cuales tienen la solución:
m̂ =(ΣXi)/n =
_
x ; s
ˆ ² = (ΣXi² - n
_
x ²)/n = [Σ(Xi -
_
x )² ]/n
Ó también:
_
x = (ΣXi) /n ; S² = [Σ(Xi -
_
x )² ] /n
14. Uno de los mejores métodos para obtener un estimador por puntos es el de máxima verosimilitud.
Supongamos que X es una v.a. con distribución probabilística f(X,Θ), en la cual Θ es un sólo
parámetro desconocido, como en la función exponencial f(x) = e- x
.
Sean X1, X2, ... , Xn los valores observados en una muestra de tamaño "n". Entonces, la
función de verosimilitud de la muestra es:
L(Θ) = L(X1, X2, ... , Xn) = f(X1;Θ) f(X2;Θ) ... f(Xn;Θ) (*)
Donde la función de verosimilitud es sólo función del parámetro desconocido. El estimador
de máxima verosimilitud de Θ es el valor de Θ que maximiza la función L(Θ). Fundamentalmente,
el estimador de máxima verosimilitud es el valor de Θ que maximiza la probabilidad de ocurrencia
de los resultados muestrales.
Este estimador puede ser obtenido diferenciando L((X1, X2, ... , Xn; Θ) con respecto a Θ y haciendo
la derivada igual a 0; es decir:
L (X1, X2, ..., Xn; Θ) = 0 (**)
───
Θ
METODO DE MAXIMA VEROSIMILITUD
15. qˆes obtenido como solución de la Ecuación (**).
A menudo, resulta más conveniente maximizar el logaritmo de la función, en vez de la función
misma, esto es:
ln L(X1, X2, ..., Xn; Θ) = 0 (***)
───
Θ
La solución para qˆ es la misma usando (**) ó (***).
Para funciones con 2 ó más parámetros la función de verosimilitud viene a ser:
1
L(X1, X2, ..., Xn; Θ1, Θ2, ... Θk) = π f(X1;Θ1, Θ2, ... , Θk) i=1,k (****)
Donde Θ1, Θ2, ... , Θk son los parámetros a ser estimados, en este caso los estimadores
máximos verosímiles se obtendrían de la solución de las ecuaciones simultáneas.
ln L(X1, X2, ..., Xn; Θ1, Θ2, ... , Θk) = 0; i = 1,...,k
─────
Θ
El (E.M.V.) cumple muchas de las propiedades mencionadas antes.
16. Ejemplo:
Los tiempos entre sucesivos arribos de vehículos en un flujo de tráfico fueron observados como
sigue:
1.2, 3.0, 6.3, 10.1, 5.2, 2.4, 7,1 seg.
Supóngase que los tiempos entre arribos de vehículos sigue una distribución exponencial;
esto es:
fT(t) = e
i
t
-
1
Determine el estimador (EMV) del tiempo medio entre arribos.
De la ecuación (*) la función de verosimilitud de las siete observaciones es:
L(t1, t2, ..., t7; ) =
-
7
1
)
exp(
i
t
= ( )-7
Exp (- Σti)/
Donde ti es el i-ésimo tiempo observado entre arribos sucesivos de acuerdo a (**)
L
= -7 -8
exp(-Σti/) + -7
Exp (- Σti/) 2
i
t
= 0
-8
[-7 +ti/] Exp (-Σti /) = 0
De los cuales obtenemos:
̂ =
7
1 7
i
t
= 5.04 seg.
Por lo tanto el estimador máximo verosímil ̂ desde una muestra de tamaño n es:
n
i
t
n 1
1
̂
17. Un intervalo de valores se utiliza para estimar
un parámetro desconocido. El error se indica
de dos manera: por la extensión del intervalo y
por la probabilidad de obtener el verdadero
parámetro de la población que se encuentra
dentro del intervalo.
Ejemplo:
Para el próximo mes se espera que la
precipitación pluvial pueda variar entre 500 y
600 mm, con un error de 5%.
Estimación por intervalo
18. INTERVALOS DE CONFIANZA
La estimación por intervalos consiste en encontrar en base a una muestra X1, X2, ... Xn,
los valores L y U entre los cuales se encuentra con una probabilidad conocida el
verdadero valor del parámetro “Ө “ que hay que estimar, tal que:
P ( L ≤ Ө ≤ U ) = 1 - (1)
E
El
l i
in
nt
te
er
rv
va
al
lo
o r
re
es
su
ul
lt
ta
an
nt
te
e:
:
L ≤ Ө ≤ U (2)
s
se
e d
de
en
no
om
miin
na
a I
In
nt
te
er
rv
va
allo
o d
de
e C
Co
on
nf
fiia
an
nz
za
a d
de
e 1
10
00
0 (
( 1
1 -
-
)
) %
% p
pa
ar
ra
a e
ell p
pa
ar
rá
ám
me
et
tr
ro
o d
de
es
sc
co
on
no
oc
ciid
do
o
.
.
L Límite inferior ; U Límite superior; = 1 - se denomina Coeficiente de
confianza
NTERPRETACIÓN. Si muchas muestras aleatorias se obtuvieran, y si se calcula un intervalo
de confianza de 100(1 - )% con respecto a Ө, para cada muestra; entonces el 100 ( 1 -
) % de los intervalos contendrán al verdadero valor de Ө.
21. Intervalo para la media µ, σ𝟎
2 conocida
Población Normal
n
x
Z
pero
s
m
-
=
s
m
s
s
m
-
-
-
-
-
-
-
1
Pr
1
Pr
1
Pr
0
0
0
0
0
0
Z
n
x
Z
n
x
Z
x
Z
Z
Z
Z
x
-Z0 Z0
μ1–α :
n
Z
X 0
2
1
s
-
-
22. INTERVALO DE CONFIANZA DEL TOTAL POBLACIONAL ( Nm )
Silamuestraaleatoriadetamañon,seescogedeunapoblaciónfinitadetamañoN,entoncesel
totaldelapoblaciónXiesestimadopuntualmentepor N
-
X .
Comoloslímitesdeconfianzademes:
-
X ±k -
X
s ,dondekesmultiplicadordeconfianza
k=
2
1
-
Z y -
X
s esel error estándar de
-
X ,entonces elintervalode confianza del (1– )
100paraeltotalpoblacionalNmes:
N(
-
X -k -
X
s )≤ Nm≤ N(
-
X +k -
X
s )
24. Ejemplo
Un analista de investigación de mercado quiere estimar el
promedio del ingreso familiar mensual de una determinada
población.
Determine el intervalo de confianza del 95% si en una
muestra aleatoria de tamaño 100 de esa población se
encuentra que el promedio del ingreso familiar era de $ 500.0
Suponga que el ingreso familiar mensual se distribuye
normalmente con s0 = $ 100.0
Determine el intervalo de confianza al 95% como en (a) si se
supone que la población consiste de 2000 ingresos familiares
Estimar un intervalo del 95% de confianza para el total
poblacional si N = 2000 y = $ 500.0 además s0 = $ 100.0
25. Solución
a) Datos: n = 100,
-
X = 500.0 , s0 = $ 100.0 ; Z95 = 1.96 ( tabla normal )
Por tanto como
-
X N ( m,
n
0
s ), entonces:
- -
-
n
Z
X 0
2
1
s
= 500 – 1.96 ( 100 / 10 ) = 480.4
-
-
n
Z
X 0
2
1
s
= 500 + 1.96 ( 100 / 10 ) = 519.6
m 95% : 480.4 , 519.6
b) Muestreo sin reemplazo n = 100, en este caso:
75
.
9
1
2000
100
2000
100
1
0
-
-
-
-
-
n
N
n
N
n
X
s
s
Los límites del intervalo de confianza:
89
.
480
)
75
.
9
(
96
.
1
500
1 2
1
0
2
1
-
-
-
-
- -
-
-
-
-
X
Z
X
N
n
N
n
Z
X s
s
11
.
519
)
75
.
9
(
96
.
1
500
2
1
-
-
-
X
Z
X s
m 95% : 480.89 , 519.11
26. i) Finita
Población
E
Z
n ..
..
119
5679
.
118
)
18
(
)
100
(
)
96
.
1
(
2
2
2
2
2
2
2
1
-
s
ii) 112
985
.
111
)
1
2000
(
)
18
(
)
100
(
)
96
.
1
(
)
2000
(
)
100
(
)
96
.
1
(
)
1
( 2
2
2
2
2
2
2
2
1
2
2
2
2
1
-
-
-
-
s
s
Z
E
N
N
Z
n
Nμ95% : N ( -
-
-
X
Z
X s
2
1
) : 961 780 , 1’038 220
N
-
X = 2000 (500) = $ 1’000 000
N
-
X ± -
- X
Z
N s
2
1
=2000 x 500 ± 2000 x 19.11 = 1’000 000 ± 38 220
Luego:( 961 780 ≤ N μ ≤ 1’038 220 )
Si el total poblacional se estima en $ 1’000 000, se tiene una confianza
del 95% de que el error de estimación no será superior a $ 38 220
c) Tamaño de muestra.
d) Intervalo para el total poblacional
27. 1. Intervalode ConfianzaparalaMedia µ. (σ2
: Desconocida.)
1.1. POBLACIONNO NORMAL.
SiX no esnormalpero n essuficientemente grande (n≥ 30),entoncespor elT.L.C.,
)
1
,
0
(
N
X
X
-
-
-
s
m y se deduceque elintervalode confianza del(1-α) 100para µes aprox.:
-
-
-
-
-
-
-
X
X
Z
X
Z
X s
m
s
2
1
2
1
donde: -
X
s se sustituye por
n
S
X
-
s si el muestreo es con o sin sustitución de una población
infinita ( con sustitución enunapoblación finita de tamañoN )
y por
1
-
-
-
N
n
N
n
S
X
s si el muestreo es sin sustitución en una población finita de tamaño
N,en este casousamos
S :desviación estándar insesgada.
28. U
( Intervalo de m )
L x
/ 2
1 -
T
x
/ 2
1.1. POBLACION NORMAL
Si
-
X y
S son la media y la desviación estándar respectivamente para una muestra aleatoria de
confianza de ( 1- α ) 100 para μ es :
n
S
t
X
n
S
t
X n
n
-
-
-
-
-
-
- 1
,
2
1
1
,
2
1
m
donde: 1
,
2
1 -
- n
t es un valor que se deduce de la tabla t-student con n-1 grados de libertad, tal que
P ( T≤ 1
,
2
1 -
- n
t ) = 1 – α / 2
NOTA: La consideración de normalidad es importante sobre todo para muestras pequeñas
- 1
,
2
1 -
- n
t 1
,
2
1 -
- n
t
29. EJEMPLO 2
La tabla siguiente muestra los datos relativos a la tormenta, las precipitaciones y escorrentía sobre un rio
determinado.
Tormenta Precipitación ( pulgadas) Tormenta (pulgadas)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
1.11
1.17
1.79
5.62
1.13
1.54
3.19
1.73
2.09
2.75
1.20
1.01
1.64
1.57
1.54
2.09
3.54
1.17
1.15
2.57
3.57
5.11
1.52
2.93
1.16
0.52
0.40
0.97
2.92
0.17
0.19
0.76
0.66
0.78
1.24
0.39
0.30
0.70
0.77
0.59
0.95
1.02
0.39
0.23
0.45
1.59
1.74
0.56
1.12
0.64
a. Calcular la media, desviación estándar para la precipitación y escorrentía
Usando la varianza muestral, determine e interprete un intervalo del 95% de confianza para la media
poblacional de la precipitación y escorrentía
30. Solución
Para la precipitación
Media muestral = 53.89/25 = 2.16 in.
Varianza muestral = 1/24 (153.9 – 25(2.16)2
) = 1.53
D.E = 1.24 in.
Error estándar de la media = 0.25
Para la Escorrentía
Media muestral = 20.05/25 = 0.80 in.
Varianza muestral = 1/24( 24.68 – 25(0.80)2
) = 0.36
D,E = 0.60 in.
Error estándar de la media = 0.60/5 = 0.12
31. Los intervalos de confianza pedidos serían:
a) X: precipitación (pulgadas).
µ: se quiere estimar ( verdadero contenido medio )
n =25
Para 100 ( 1 – μ ) % = 95 % de la tabla se obtiene: 1
,
2
1 -
- n
t = 24
,
975
.
0
t =2.064
De la muestra se tiene:
-
X =2.16 in,
S =1.24 in
-
X
s (error estándar de
-
X ) = 574
.
0
16
.
2
24
.
1
5
S
Los límites de confianza será:
L:
-
X - 1
,
2
1 -
- n
t -
X
s =2.16 – 2.064 x 0.574 = 0.975
U:
-
X + 1
,
2
1 -
- n
t -
X
s =2.16 + 2.064 x 0.574 = 3.345
μ95% : 0.975 , 3.345 in
32. b). X: Escorrentia (pulgadas).
µ: se quiere estimar ( verdadero contenido medio )
n =25
Para 100 ( 1 – μ ) % = 95 % de la tabla se obtiene: 1
,
2
1 -
- n
t = 24
,
975
.
0
t =2.064
De la muestra se tiene:
-
X =0.80 in,
S =0.60 in
-
X
s (error estándar de
-
X ) = 75
.
0
80
.
0
60
.
0
5
S
Los límites de confianza será:
L:
-
X - 1
,
2
1 -
- n
t -
X
s =0.80 – 2.064 x 0.75 = -0.748
U:
-
X + 1
,
2
1 -
- n
t -
X
s =0.80 + 2.064 x 0.75= 2.348
μ95% : -0.748 , 2.348 in
33. Cuando se desea determinar el intervalo de confianza de una proporción (el
parámetro p de la distribución de Bernoulli), se utiliza el estimador:
n
X
muestra
la
de
tamaño
muestra
la
en
éxitos
de
número
p
Es la proporción de observaciones de una muestra aleatoria de tamaño “n” que pertenece a una clase de
interés,
Entonces si n es suficientemente grande, utilizando el T:L:C, considerando que
p N[P, (P(1-P))/n, es decir
n
P
P
P
p
Z
)
1
( -
-
Esta es usada como función pivotal para construir el intervalo de (1–α) 100% de confianza.
( )
-
-
-
- 1
2
2 1
1 Z
Z Z
P
-
-
-
-
-
- 1
)
1
(
)
1
(
2
2 1
1
n
p
p
p
p
n
p
p
p
P Z
Z
p ( 1 – α ) 100% :
n
p
p
p Z
)
1
(
2
1
-
-
Intervalo de Confianza para una Proporción Poblacional P
34. Ejemplo
Una muestra aleatoria de 75 probetas, 12 tienen un acabado superficial más áspero de lo que las
especificaciones permiten. Por tanto una estimación puntual de la proporción de probetas en la
poblaciónqueexcedenlasespecificacionesderugosidadPes 16
.
0
75
12
n
X
p .Calculeun
intervalobilateraldel95%deconfianzaparaP.
Solución
n
p
p
p
p
n
p
p
p Z
Z
)
1
(
)
1
(
975
.
0
975
.
0
-
-
-
75
84
.
0
16
.
0
96
.
1
16
.
0
75
84
.
0
16
.
0
96
.
1
16
.
0
x
p
x
-
p(95%) : 24
.
0
08
.
0
p
35. INTERVALO DE CONFIANZA PARA LA VARIANZA ( σ ² )
1 -
x
/ 2
f (x )
Sea
-
X la media de la muestra X1, X2, …, Xn de tamaño n seleccionada de una población normal
con varianza σ ² ( parámetro desconocido ).
Un estimador insesgado de s² es:
1
)
( 2
2
-
-
-
n
X
X
S
i
. Además para ( n≥ 2 ) , la v.a. l
g
n
S
n
X .
1
2
2
2
2 )
1
(
-
-
s
Usamos esta función para determinar un intervalo de confianza ( 1 – α ) 100% para σ².
2
α/2
2 2 2
Xα/2 X1-α/2
Sea
-
-
-
-
1
2
1
,
2
1
2
2
1
,
2
n
n
X
X
X
P ; sustituyendo 2
2
2 )
1
(
s
-
S
n
X
Sea
s
-
-
-
-
-
-
1
)
1
(
)
1
(
2
1
,
2
2
2
2
1
,
2
1
2
n
n
X
S
n
X
S
n
P
Donde: 1
,
2
1
2
-
- n
X y 1
,
2
2
-
n
X son valores obtenidos de la tabla chi-cuadrado o software
36. Ejemplo
Las temperaturas en grados Celsius medidos en un experimento se consideran normales. Si se tomaron las
siguientes muestras: 10.1, 9.7, 10.3, 10.4, 9.9, 9.8, 9.9, 10.1, 10.3, 9.9
Encuentre un intervalo de confianza del 95% para la varianza poblacional (s2
)
Solución
Con a = 0.05, n = 10 , = n-1 = 9 g.l. en la chi-cuadrado
1
,
2
2
-
n
X = 9
,
025
.
0
2
X = 2.70 y 1
,
2
1
2
-
- n
X = 9
,
975
.
0
2
X = 19.02
- De los datos maestrales se tiene
2
S = 0.056
- Los límites de confianza para 2
s es :
( ) 0265
.
0
02
.
19
)
056
.
0
(
9
1
2
1
,
1
2
2
-
-
-
n
X
S
n
L
( ) 1867
.
0
70
.
2
)
056
.
0
(
9
1
2
1
,
2
2
-
-
n
X
S
n
U
σ² 95% : 0.0265 , 0.1867
σ95% : 0.1628 , 0.432
37. Intervalo de Confianza para la Razón de 02 Varianzas
1 -
x
/ 2
f (x )
Si
2
1
S y
2
2
S son las varianzas de 02 muestras aleatorias independientes de tamaños n1 y n2
seleccionados respectivamente de 02 poblaciones normales con varianzas 𝜎1
2
y 𝜎2
2
, entonces la
construcción del intervalo de confianza de (1 – α ) 100% para 2
2
2
1
s
s se utiliza la
distribución F(n1 -1, n2 -1) de la variable
2
2
2
2
2
1
2
1
s
s
S
S
F
F ( 1 , 2 ) ; P( F1 F F2 ) = 1-
1
2
2
1
2
2 ,
,
1
2
2
2
1
2
2
2
1
,
,
2
2
2
1
s
s
-
F
S
S
F
S
S
2
1
2
1
2
2
,
,
1
,
,
1
-
F
F
F1 = 2
1
2 ,
,
F F2= 2
1
2
1 ,
, V
V
F
-
Fig. Intervalo de confianza de
2
2
1
s
s
38. EJEMPLO 1:
La siguiente tabla proporciona datos sobre la precipitación total registrada en
11 estaciones meteorológicasdedos provinciasdelaregión cajamarca:
Prov.A10089 84120 1301056070 90 108130
Prov.B12011596115140120 7590108130 135
a) Darunaestimación puntual delamediaylavarianzaparaambas prov.
b)Estimarmediante unintervalodeconfianza95%elcocientedelasvarianzas
yenbaseaeste,determinarsi lasvarianzassonigualeso diferentes.
39. a) MA =
-
1
X = 98.72, VARIA NZA (A) =
2
1
S = 524.82
MB = 2
-
X = 113.09, VARIANZA (B) =
2
2
S = 389.49
b) X ( precipitación total ) prov A N ( μ1, 2
1
s ) n1 = 11
Y (precipitación total) prov B N ( μ2, 2
2
s ) n2 = 11
Con α = 0.05 g.l. 1 = n1 – 1 = 10 y 2 = n2 - 1 = 10 ;
de la muestra:
2
1
S = 524.82 y
2
2
S = 389.49
(1.35)F0.025,10, 10
2
2
2
1
s
s (1.35)F0.975,10,10
en tabla F se encuentra:
10
,
10
,
975
.
0
F = 3.72;
Entonces: 1
2
2 ,
, V
V
F = 10
,
10
,
025
.
0
F = (1/ 10
,
10
,
975
.
0
F ) =(1/3.72)=0.27
0.3645
2
2
2
1
s
s 5.022
Como el intervalo contiene al (1), las dos varianzas pueden considerarse iguales.
SOLUCION
40. Ejemplo 2: Suponga que dos máquinas A y B, producen independientemente el mismo tipo de probetas y
que el tiempo que cada una emplea en producirlos se distribuye normalmente con varianzas
respectivas 2
1
s y 2
2
s desconocidas. Se han tomado dos muestras aleatorias, una de A y otra de B,
obteniéndose los siguientes tiempos en minutos:
Muestra de A: 17, 23, 21, 18, 22, 20, 21, 19
Muestra de B: 13, 16, 14, 12, 15, 14
Construir un intervalo de confianza del 95% para
2
2
2
1
s
s
41. Sean
-
1
X y
-
2
X las medias de dos muestras aleatorias independientes de tamaños n1 y n2
seleccionadas de 2 poblaciones con medias µ1 y µ2 y varianzas 2
1
s y 2
2
s supuestas conocidas.
*
-
1
X -
-
2
X es un estimador puntual de µ1 - µ2
- Si las 2 poblaciones son normales
- Entonces (
-
1
X -
-
2
X ) N (µ1 - µ2 ,
2
2
2
1
2
1
n
n
s
s
) ; ( para n1 2 y n2 2 )
- Si las poblaciones no son normales, pero n1 y n2 son grandes ( n1, n2≥30 )
- Entonces
-
1
X -
-
2
X N (µ1 - µ2 ,
2
2
2
1
2
1
n
n
s
s
), por tanto:
2
2
2
1
2
1
2
1
2
1 )
(
n
n
X
X
s
s
m
m
-
-
-
-
-
tiene distribución exacta o aproximada N ( 0, 1 )
El intervalo de confianza del (1– ) 100% de µ1 – µ2, es:
-
-
-
-
-
-
-
-
-
-
-
-
x
σ
2
α
1
Z
2
X
1
X
2
μ
1
μ
x
Δ
σ
2
α
1
Z
2
X
1
X
IntervalodeConfianzapara ∆µ:varianzas[ 2
1
s y 2
2
s conocidas].
42. Intervalo de Confianza para ∆μ: 2
1
s y 2
2
s
Desconocidos.
A) Poblaciones No Normales.
Si
-
1
X y
-
2
X son medias de muestras aleatorias independientes de
tamaños n1 y n2 seleccionadas de poblaciones cuya distribución no es
normal con 2
1
s y 2
2
s supuestas desconocidas, entonces siempre que (
n1≥ 30 y n2≥ 30 )
El intervalo de confianza de ( 1 – α ) % para μ1 – μ2,
donde s2
1 y s2
2 se estiman particularmente por
2
1
S y
2
2
S
es:
2
2
2
1
2
1
1
2
1
2
1
2
2
2
1
2
1
1
2
1 2
2
n
S
n
S
Z
X
X
n
S
n
S
Z
X
X
-
-
-
-
-
-
-
-
-
-
m
m
43. 1.1. Intervalo de Confianza para ∆m: 2
1
s y 2
2
s Desconocidos.
Varianzas Supuestas Iguales: 2
1
s = 2
2
s = 2
s
El intervalo de confianza ( 1 – ) x 100% para ∆ m , se basa en la función pivotal:
2
,
1
2
2
1
2
2
1
2
1
2
1
2
)
(
)
(
-
-
-
-
-
-
-
n
n
c
c
t
n
S
n
S
X
X
T
m
m
donde:
2
)
1
(
)
1
(
2
1
2
2
2
2
1
1
2
-
-
-
n
n
S
n
S
n
Sc
∆ m (1- )100% :
2
1
2
,
1
2
1
1
1
)
( 2
1
2
n
n
S
t
X
X c
n
n
-
-
-
-
-
44. Varianzas Desconocidas Supuestas Diferentes: 2
1
s ≠ 2
2
s
En este caso la función pivotal para el intervalo de (1– )100% para ∆m:
m
m
,
1
2
2
2
1
2
1
2
1
2
1
2
)
(
-
-
-
-
-
-
t
n
S
n
S
X
X
donde:
2
1
1 2
2
2
2
2
1
2
1
2
1
2
2
2
2
1
2
1
-
n
n
S
n
n
S
n
S
n
S
se aproxima al entero mayor más
cercano
Intervalo de ( 1 – ) x 100% de confianza es:
∆ m (1- )100% : -
-
-
-
-
X
t
X
X s
,
1
2
1 2
)
(
45. Ejemplo
Una compañía fabricante de automóviles ha registrado observaciones de 02 marcas de baterías
usadas en sus coches . 40 observaciones de la marca A mostraron una
-
A
X = 32 meses; 45
observaciones de la marca B mostraron
-
B
X = 30 meses. LA experiencia indica que las
desviaciones estándar para ambas marcas de baterías son iguales a 04 meses. ¿ Cuáles son los
límites de confianza para la diferencia verdadera en vida media entre los 02 tipos de baterías con 1
– α = 0.95 ?
Solución
Para este tipo de problema se tiene ∆
-
X =
-
A
X -
-
B
X = 32 – 30 = 2; 2
1
-
Z = 1.96
85
.
0
45
4
40
4 2
2
-
X
s , sustituyendo datos en fórmula:
2 ± 1.96 ( 0.87 ) = 2 ±1.7
∆ m 95% : 0.3 ≤ ∆ m ≤ 3.7
46. Ejemplo
Una empresa fabrica un mismo producto en 02 máquinas. Una muestra aleatoria de 9
productos de la máquina 1, ha dado los siguientes tiempos de fabricación en
segundos:
12,28,10,25,24,19,22,33,17
mientras queunamuestra aleatoriade8 productos dela máquina2, ha dado los
siguientestiemposdefabricaciónensegundos:
16,20,16,20,16,17,15,21
a)Construirunintervalodel95%para∆m:supongaque 2
1
s = 2
2
s
b)Construirunintervalodel95%para∆m:supongaque 2
1
s ≠ 2
2
s
47. Solución
a) X1 y X2 son los tiempos empleados para las máquinas 1 y 2 respectivamente,
de las muestras se tiene:
n1= 9,
-
1
X =21.111, 1
S =7.4237; n2 = 8,
-
2
X =17.625, 2
S =2.326
La diferencia de medias maestrales
-
1
X -
-
2
X = 21.111 – 17.625 = 3.486
Si asumimos que 2
1
s = 2
2
s , entonces -
X
s será:
8
1
9
1
2
8
9
)
33
.
2
(
7
)
42
.
7
(
8
1
1
2
2
2
1
2
1
-
-
-
-
x
n
n
Sc
X
X
s
74
.
2
528
.
7
236
.
0
897
.
31
131
.
2
15
,
975
.
0
15
,
1 2
- t
t
L =
-
1
X -
-
2
X -2.131 ( 2.74 ) = 3.486 – 5.8468 = -2.3608
S =
-
1
X -
-
2
X +2.131 ( 2.74 ) = 3.486 + 5.8468 = 9.3328
∆ m 95% : -2.3608 , 9.3328
48. Solución (b)
Siasumimosque 2
1
s ≠ 2
2
s ;el error estándarde
-
1
X -
-
2
X ó -
X
s será:
6
.
2
8
)
33
.
2
(
9
)
42
.
7
( 2
2
2
2
2
1
2
1
2
1
-
-
-
n
S
n
S
X
X
s
11
17
.
10
2
17
.
12
2
1
8
8
)
33
.
2
(
1
9
9
)
42
.
7
(
8
)
33
.
2
(
9
)
42
.
7
(
2
2
2
2
2
2
2
-
-
Elintervalo para 95% de confianzat0.975,11 =2.201,portanto:
7226
.
5
375
.
3
)
6
.
2
)(
201
.
2
(
486
.
3
)
( ),
1
(
2
1
2
-
- -
-
-
-
s
X
t
X
X
∆m 95% : -2.3476,9.0976
49. La siguiente tabla proporciona datos sobre la precipitación total registrada en 11 estaciones
meteorológicas dedosprovincias delaregióncajamarca:
Prov.A1008984120130105607090108130 (mm)
Prov.B120115961151401207590108130135(mm)
a) Dar unaestimaciónpuntual delamediaylavarianzaparaambas prov.
b) Estimar mediante un intervalo de confianza 95% el cociente de las varianzas y en base a este,
determinar silas varianzassoniguales odiferentes.
Enbaseaunintervalodel95% deconfianzaparaladiferenciade mediasdelas precipitacionestotales,
determinar si estasson iguales odiferentes enambas provinciasderegistro
Ejemplo
50. SOLUCION
a) MA =
-
1
X = 98.72, VARIA NZA (A) =
2
1
S = 524.82
MB = 2
-
X = 113.09, VARIANZA (B) =
2
2
S = 389.49
b) X ( precipitación total ) prov A N ( μ1, 2
1
s ) n1 = 11
Y (precipitación total) prov B N ( μ2, 2
2
s ) n2 = 11
Con α = 0.05 g.l. 1 = n1 – 1 = 10 y 2 = n2 - 1 = 10 ;
de la muestra:
2
1
S = 524.82 y
2
2
S = 389.49
(1.35)F0.025,10, 10
2
2
2
1
s
s (1.35)F0.975,10,10
en tabla F se encuentra:
10
,
10
,
975
.
0
F = 3.72;
Entonces: 1
2
2 ,
, V
V
F = 10
,
10
,
025
.
0
F = (1/ 10
,
10
,
975
.
0
F ) =(1/3.72)=0.27
0.3645
2
2
2
1
s
s
5.022
51. ∆ μ(1- % :
2
1
2
,
1
2
1
1
1
)
( 2
1
2
n
n
S
t
X
X c
n
n
-
-
-
-
-
donde:
2
)
1
(
)
1
(
2
1
2
2
2
2
1
1
2
-
-
-
n
n
S
n
S
n
Sc
52.
53. EJEMPLO
El gerente de operaciones de una empresa debe decidir entre dos procesos de
producción A y B de un producto. Para esto eligió una muestra al azar de 10
operadores entre los más eficientes y cada uno de ellos utilizó los dos procesos
de manufactura, obtuvo los siguientes resultados de los tiempos en minutos:
Operador 1 2 3 4 5 6 7 8 9 10
Proceso A 10 10 11 12 12 13 13 15 15 16
Proceso B 8 11 11 10 9 11 10 12 14 15
Diferencia
di
2 -1 0 2 3 2 3 3 1 1
Di
2
4 1 0 4 9 4 9 9 1 1
Construys un intervalo del 985 de confianza para md .Se podría afirmar que
el proceso de manufactura B reduce el tiempo de fabricación del producto?.
Solución
𝐷 = (16/10) = 1.6
Sd =
42−10(1.62)
10−1
= 1.3499
ES = 1.3499/10 = 0.42688
T0.99,9= 2.821, sustituyendo datos, se obtiene:
( 0.3958, 2.8042).
Interpretación. El Proceso B reduce el tiempo de fabricación del producto
54. Intervalo de Confianza para la diferencia entre 2 proporciones (P1 –
P2)
Sean 1
p y 2
p las proporciones de éxitos en dos muestras aleatorias independientes de
tamaños n1 y n2 seleccionados de dos poblaciones binomiales B ( n1, p1 ) y B ( n2, p2 ) . si
n1 y n2 son suficientemente grandes, entonces
-
1
1
1
1
1
)
1
(
,
n
p
p
p
N
p y
-
2
2
2
2
2
)
1
(
,
n
p
p
p
N
p , entonces 1
p - 2
p tiene distribución aproximadamente
normal 1
p - 2
p
-
-
-
-
2
2
2
1
1
1
2
1
)
1
(
)
1
(
,
n
p
p
n
p
p
p
p
N , por tanto:
Pivotal
Función
N
n
q
p
n
q
p
p
p
p
p
Z ...
).......
1
,
0
(
)
(
1
2
2
1
1
1
2
1
2
1
-
-
-
Por tanto el intervalo de confianza de (1-)100% para P1-P2, es:
∆p ( 1 – ) 100% :
2
2
2
1
1
1
1
2
1 2
n
q
p
n
q
p
p
p Z
-
-
55. Ejemplo
: El Ingeniero de control de calidad de una industria opina que el 15% de la producción de la linea de
producción A y el 10% de la línea de producción B no cumplen con las especificaciones normales de
dulzura. En una muestra aleatoria simple de 150 artículos de la línea de producción A se encontró que 30
tenían ese problema. Una muestra aleatoria simple e independiente de 100 artículos de la línea de
producción B reveló que 07 estaban fuera del rango normal.
Asumiendo que la evaluación del control de calidad es correcto.
Constrya un intervalo del 95% de confianza para la diferencia de proporciones
Solución.
Como n1 = 150 y n2 = 100 son grandes P1 - P2 normal aproximadamente.
05
.
0
10
.
0
15
.
0
2
1
-
- p
p
m
04
.
0
100
)
90
.
0
)(
10
.
0
(
150
)
85
.
0
)(
15
.
0
(
2
1
- p
p
s
Si el control es correcto, las proporciones muestrales observadas son:
P1 = 30 / 150 = 0.20 P2 = 7 / 100 = 0.07
Por tanto el intervalo de confianza del 95% para P1-P2, sería:
∆p ( 1 – ) 100% :
2
2
2
1
1
1
1
2
1 2
n
q
p
n
q
p
p
p Z
-
-
Reemplazando valores, se tiene:
56. Ajuste para poblaciones finitas
El error estándar de la estimación sufre un ajuste,
cuando se trata de una población finita.
Error estándar de la media
Error estándar de la proporción
Si la proporción n/N es menor a 0,05 se omite el ajuste.
1
.
-
-
N
n
N
n
X
s
s
1
.
)
1
(
-
-
-
N
n
N
n
p
p
p
s
57. Hoja de Comprobación
1. Se dice que un estadístico es un estimador eficiente de un
parámetro si, al aumentar el tamaño de la muestra, es casi
seguro que el valor del estadístico se acerque mucho al valor
del parámetro.
2. Una estimación de intervalo es un intervalo de valores
utilizado para estimar la forma de la distribución de una
población
3. Si un estadístico tiende a tomar valores mayores que el
parámetro de la población con la misma frecuencia con que
tiende a tomar valores por debajo, decimos que el estadístico
es un estimador imparcial del parámetro.
58. 4. La probabilidad de que un parámetro de población se encuentre
dentro de una estimación de intervalo dada se conoce como
nivel de confianza.
5. Al aumentar el tamaño de la muestra, la distribución t tiende a
tomar una forma más plana.
6. Debemos utilizar siempre la distribución t, en lugar que la
distribución normal , en los casos en que se desconozca la
desviación estándar de la población
7. Podemos obtener una burda estimación de la desviación
estándar de una población si contamos con información
acerca de su rango.
59. 8. Cuando se utiliza la distribución t para hacer estimaciones,
se debe suponer que la población es aproximadamente
normal
9. No siempre es deseable utilizar altos niveles de confianza,
debido a que estos producen grandes intervalos de
confianza.
10.Existe una distribución t distinta para cada posible tamaño
de muestra.
11.Una estimación puntual a menudo resulta insuficiente,
debido a que es correcta o incorrecta.
60. 12.Se dice que una media de muestra es un estimador imparcial
de una media de población debido a que ningún otro estimador
podría extraer de la muestra información adicional acerca de la
media de la población
13.El estimador de s que se utiliza con mas frecuencia es s
14.El error estándar de la población se calcula como n
p
p /
)
1
( -
15.El numero de grados de libertad que se utilizan en una
estimación de distribución t es igual al tamaño de la muestra.
61. 16.La distribución t es poco probable que sea aproximada por
la distribución normal conforme aumenta el tamaño de la
muestra.
17.No es necesario usar la distribución t en estimación si se
conoce la desviación estándar de la población
18.La mediana de la muestra es siempre el mejor estimador de
la mediana de la población
19.Conforme aumenta el ancho de un intervalo de confianza, el
nivel de confianza asociado con el intervalo también se
incrementa.
62. 20.La estimación del error estándar de la media de una
población finita utilizando la estimación de la desviación
estándar de la población requiere del uso de la distribución t
para calcular intervalos de confianza subsecuentes
21.Los valores que se encuentran en la tabla de la distribución t
corresponden a la probabilidad de que el parámetro real de la
población se encuentre fuera de nuestro intervalo de confianza
22.En una distribución normal, 100% de la población se
encuentre fuera nuestro intervalo de confianza