3. La teoría de la inferencia estadística puede definirse
como aquellos métodos que permiten hacer inferencias o
generalizaciones sobre una población.
Se eligen estimadores de manera tal que el modelo
tenga el mejor ajuste al comportamiento observado, y
luego se estudia la naturaleza de esos estimadores como
variable aleatoria.
n
R, m , s2
, X , S
2
El objetivo es estimar los parámetros
de la población desconocidos , como la
proporción, la media y la varianza,
mediante el calculo de estadísticos de
muestras aleatorias y la aplicación de
la teoría de las distribuciones
muestrales.
pˆ
9. Propiedades de un buen Estimador
ss
22
ˆˆ 21
Decimos que es un estimador mas eficaz de queˆ1 ˆ ˆ2
10.
11. C) Suficiencia
Un estimador es suficiente si utiliza una cantidad de la
información contenida en la muestra que ningún otro
estimador podría extraer información adicional de la
muestra sobre el parámetro de la población que se esta
estimando.
Ejemplo: cuando se calcula la media de la muestra, se
necesitan todos los datos. Cuando se calcula la
mediana de una muestra sólo se utiliza a un dato o a
dos. Por lo tanto, si utilizamos a todos los datos de la
muestra como es en el caso de la media y la varianza;
se tendrá un estimador suficiente.
15. METODO DE MAXIMA VEROSIMILITUD
La estimación por máxima verosimilitud
(palabra del latín “verus” y de “similis”
semejante. O sea que la verosimilitud es
aquello que hace que algo se asemeje a lo
real, lo creíble) representa uno de los métodos
mas importantes en la estadística inferencial.
El método de máxima verosimilitud permite
utilizar el conocimiento de la distribución para
determinar un estimador adecuado para
parámetros de cualquier distribución.
16. METODO DE MAXIMA VEROSIMILITUD
Consiste en un método general de estimación que
brinda estimadores asintóticamente insesgados y
de varianza mínima cuando n es grande.
Brinda estimadores para parámetros de cualquier
distribución que cumplen con las propiedades de
los estimadores puntuales.
La técnica del método consiste en observar todas
las muestras aleatorias y elegir como estimador
del parámetro desconocido aquel que maximice la
probabilidad conjunta de los valores de la muestra.
17. Dada una muestra aleatoria X1, X2, . . . , Xn de una
población con función de densidad (o cuantía), f(x,
) con desconocido; donde cada una de las
variable aleatoria tienen como función o ley fi (xi, ).
f (x1, x2, . . . , xn, ) = f1(x1, ) f2(x2, ) . . . fn(xn, )
f (x1, x2, . . . , xn, ) = f(x1, ) f(x2, ) . . . f(xn, )
f (x1, x2, . . . , xn, )
n
1i
i,xf
El estimador de máxima verosimilitud (E. M. V.) del parámetro es aquel que
hace que la función de probabilidad conjunta f (x1, x2, . . . , xn, ) se maximice para
un valor observado .
22. E S T I M AC I O N P O R I N T E R VA LO S
D E C O N F I A N Z A
23. I N T E R VA LO S D E C O N F I A N Z A
110 < m < 116
La estimación por intervalos nos permite conocer con que error
estamos trabajando. Consiste en dar 2 valores I y S tales que la
probabilidad de que I y S encierren al verdadero valor de sea
igual a " 1 - " (confianza del intervalo ó nivel de confianza).
P (I < < S) = 1 -
I y S son variables dependen del valor del estadístico para una
muestra especifica, y también de la distribución de muestreo no así
ya que es un número que no conocemos, por eso se lee: la
probabilidad que I y S encierren al valor es 1 - ”
Xˆm 113m
ˆ
24. I N T E R VA LO S D E C O N F I A N Z A
VARIABLES FUNDAMENTALES
Una variable aleatoria es una variable fundamental o
pivotal si y solo si:
1. depende del parámetro (no conocido) al cual se le
construye el intervalo
2. depende del estimador de máxima verosimilitud
(conocido)
3. debe tener una distribución fija y conocida,
independiente del parámetro al cual se le construye el
intervalo
25. I N T E R VA LO S D E C O N F I A N Z A
EJEMPLO: Sea X ~ N (m, s2) donde s2 es conocida.
Hallar la variable fundamental para m.
1,0N~
n
X
]X[V
]X[EX
Z
s
m
12 3
Conocidos
26. I N T E R V A L O S PA R A U N A P O B L A C I O N
INTERVALO DE CONFIANZA PARA LA MEDIA
1. En una población normal con s2 conocida (poco realista)
El mejor intervalo de confianza es el que tiene menor
longitud. Cuando la distribución es simétrica, se demuestra
que éste es también simétrico, por lo tanto dada la
confianza “1 – ” podemos hallar dos valores de z tal que
P (z1 < z < z2) = 1 –
*La longitud L = z2 - z1 es mínima cuando z1 = – z2
1,0N~
n
X
Z
s
m
z z1 2
27. I N T E R V A L O S P A R A U N A P O B L A C I Ó N
28. I N T E R V A L O S PA R A U N A P O B L A C I O N
s
m
1z
n
X
zP
2
1
2
1
1zzzP 11
s
m
s
1
n
zX
n
zXP
2
1
2
1
Aclaración: Cuando reemplazamos las variables del intervalo por
valores numéricos tomados de una muestra particular, el
intervalo numérico NO debe tener asociada ninguna probabilidad.
- z z1 1
29. INTERPRETACIÓN DE LAS ESTIMACIONES POR INTERVALO
Cuanto mas amplio sea el intervalo de confianza ,
mas confiaremos que contiene el parámetro
desconocido.
Es mejor tener un 95% de confianza de que la vida
útil promedio de ciertos dispositivos electrónicos
esta entre los 6 y los 7 años, que tener un 99% de
confianza que esta entre los 3 y los 10 años.
LO IDEAL ES TENER UN INTERVALO CORTO
CON UN GRADO DE CONFIANZA ALTO.
(a veces las restricciones del tamaño de la muestra
impiden tener intervalos cortos ,sin sacrificar cierto
grado de confianza)
30. I N T E R V A L O S PA R A U N A P O B L A C I O N
Muestras diferentes producirán valores diferentes de x
Por lo tanto producirán diferentes estimaciones por intervalos
del parámetro µ.
𝒏𝒖𝒎𝒆𝒓𝒐 𝒅𝒆 𝒊𝒏𝒕𝒆𝒓𝒗𝒂𝒍𝒐𝒔 𝒒𝒖𝒆 𝒄𝒖𝒃𝒓𝒆𝒏 𝒍𝒂 𝒎𝒆𝒅𝒊𝒂 𝒗𝒆𝒓𝒅𝒂𝒅𝒆𝒓𝒂
𝒏𝒖𝒎𝒆𝒓𝒐 𝒅𝒆 𝒊𝒏𝒆𝒓𝒗𝒂𝒍𝒐𝒔 𝒄𝒂𝒍𝒄𝒖𝒍𝒂𝒅𝒐𝒔
→ 0,95
31.
32. I N T E R V A L O S PA R A U N A P O B L A C I O N
n
z2E2L
2
1
s
n
zx
s
m
2
1
=
s
m
s
1
n
zX
n
zXP
2
1
2
1
n
zXE
2
1
s
m
2
2
1
.
E
z
n
s
33. EJEMPLO 1:
Se encuentra que la concentración promedio de zinc que se
obtiene en una muestra de mediciones en 36 sitios
diferentes de un rio es de 2.6 gramos por mililitro.
a) Calcule los intervalos de confianza del 95% y 99% para la
concentración media de zinc en el rio. Suponga que la
desviación estándar de la población es de 0.3 gramos por
mililitro.
b) ¿Que tan grande debe ser la muestra si queremos tener
95% de confianza en que nuestra estimación de diferirá
por menos de 0.05?
m
34. I N T E R V A L O S P A R A U N A P O B L A C I Ó N
35. I N T E R V A L O S PA R A U N A P O B L A C I O N
2. En una población normal con s2 desconocida
P ( t1 < t < t2 ) = 1 -
El objetivo es que L = t2 - t1 sea mínimo lo que se
logra con:
1n
nS
X
t
m
t~
t t1 2
2
1
2
2
1
1 tttt
y
m
1t
nS
X
tP
2
1
2
1
36. I N T E R V A L O S PA R A U N A P O B L A C I O N
n
s
tx
2
1
m =
n
s
tE
2
1
n
s
t2E2L
2
1
m
1
n
S
tX
n
S
tXP
2
1
2
1
37. I N T E R V A L O S PA R A U N A P O B L A C I O N
EJEMPLO: Doce ejes elaborados mediante cierto proceso tienen un diámetro medio de
66.3mm y una desviación estándar de 8.4mm.Si supone que los datos pueden
considerarse una muestra aleatoria de una población normal, construya un intervalo de
confianza del 95% para el diámetro promedio real de los ejes elaborados mediante este
proceso.
0.975=
2
-10.05= 20.2)11(0.975t
12
8.4
2.20+
12
8.4
2.20- m 3.663.66
71.661 m
m
1
n
S
tX
n
S
tXP
2
1
2
1
Aclaración: Cuando reemplazamos las variables del intervalo por valores numéricos tomados de una muestra
particular, el intervalo numérico NO debe tener asociada ninguna probabilidad.
38. I N T E R V A L O S PA R A U N A P O B L A C I O N
EJEMPLO: El contenido de cloro (lts) en 7 contenedores
de agua es de:
Calcule un intervalo de confianza del 95% para el
contenido promedio de todos los contenedores
suponiendo una distribución aproximadamente normal
9,8 10,2 10,4 9.8 10 10,2 9,6
39. I N T E R V A L O S P A R A U N A P O B L A C I Ó N
40. I N T E R V A L O S PA R A U N A P O B L A C I O N
INTERVALO DE CONFIANZA PARA LA VARIANZA
Una estimación puntual insesgada de la varianza de una
población normal está dada por la varianza muestral, S2.
2
1n2
2
2 S1n
s
~
1 -
/2
X
2
2
1
2
2
1P 2
2
1
22
2
41. I N T E R V A L O S PA R A U N A P O B L A C I O N
s
1
1
S1n
1
P 2
2
2
2
2
2
1
s
1
S1nS1n
P 2
2
2
2
2
2
1
2
s
1
S1n
P 2
2
12
2
2
2
42. I N T E R V A L O S PA R A U N A P O B L A C I O N
EJEMPLO: Una prueba para determinar el consumo de nafta de un
motor Toyota en un recorrido de 200 km dio los siguientes resultados,
de 12 pruebas la S = 2.2 litros. Construir un intervalo del 95% para la
verdadera variabilidad del consumo de gasolina de este motor.
975.0
2
1
82.32
11025.0
21.92
11975.0
s
1
S1nS1n
P 2
2
2
2
2
2
1
2
82.3
84.411
9.21
84.411 2
s
13.932.43 2
s
43. I N T E R V A L O S PA R A U N A P O B L A C I O N
El estadístico en donde x representa el número de
éxitos en n ensayos, provee un estimador puntual de la
proporción P en un experimento binomial.
Por el teorema de limite central, para n suficientemente
grandes esta distribuida de forma casi normal
con media
y varianza
IN TERVA LO D E C ON FIA N ZA PA R A
PR OPOR C ION ES
n
xpˆ
pˆ
P
n
nP
n
x
E)pˆ(Epˆ
m
n
PQnPQ
nn
22
2
x2
n/x
2
pˆ s
ss
44. I N T E R V A L O S PA R A U N A P O B L A C I O N
INTERVALO DE CONFIANZA PARA PROPORCIONES
)1,0(N~
nQP
Ppˆ
z
1zzzP 21
1z
nQP
Ppˆ
zP
2
1
2
1
1
n
QP
zpˆP
n
QP
zpˆP
2
1
2
1
1
n
qˆpˆ
zpˆP
n
qˆpˆ
zpˆP
2
1
2
1
45. I N T E R V A L O S PA R A U N A P O B L A C I O N
Cuando n es grande se introduce un error pequeño
sustituyendo el estimador puntual para los P
debajo del radical.
Cuando n es pequeña y se cree que la proporción
desconocida P se acerca a 0 o a 1 el procedimiento
del intervalo de confianza que se establece aquí no
es confiable y por lo tanto, no se debería emplear.
Para estar seguros se requiere que tanto
o
pˆ
5qˆ.n 5pˆ.n
46. I N T E R V A L O S PA R A U N A P O B L A C I O N
EJEMPLO: En una muestra aleatoria de 500 familias de Obera
que poseen video cable se observo que 340 poseían el pack
futbol. Encontrar un intervalo de confianza del 95 % para la
proporción real de familias de Obera con el pack de futbol
instalado.
0,64 < P < 0,72
68,0500340pˆ
500
0.320.68
1.96+0.68P
500
0.320.68
1.96-0.68
1
n
qˆpˆ
zpˆP
n
qˆpˆ
zpˆP
2
1
2
1
1.96z0.975