1. Catalina Canals Cifuentes
14/03/2016
Modulo 2. Estimación puntual e
intervalar de medias y proporciones
Facultad de Ciencias Sociales
Departamento de Sociología
Estadística II
2. Contenidos
I. Estimación puntual.
II. Estimación por Intervalos: Conceptos de error
típico, nivel de confianza y error de estimación.
III. Distribución muestral de medias, Teorema
Central del límite, Ley de los grandes números.
IV. Construcción de intervalos de confianza.
V. Determinantes de la precisión de los intervalos
de confianza.
VI. Ejemplos
INTRODUCCIÓN
6. Estimación intervalar
II. ESTIMACIÓN POR INTERVALOS
Estimar un parámetro poblacional mediante un
rango de valores que contiene al parámetro
poblacional con una probabilidad conocida.
7. Error típico o Error estándar (SE)
II. ESTIMACIÓN POR INTERVALOS
SE(e): Desviación estándar del estimador e.
Parámetro:
𝑺𝑬(𝒆) = 𝒊∈𝑵(𝒆𝒊 − 𝒆)𝟐
𝑵
𝑺𝑬(𝒑𝒓𝒐𝒎𝒆𝒅𝒊𝒐) =
𝝈
𝒏
=
𝒊∈𝑵(𝒙𝒊−𝝁)𝟐
𝑵
𝒏
𝑻𝒐𝒕𝒂𝒍 𝒅𝒆 𝒎𝒖𝒆𝒔𝒕𝒓𝒂𝒔 𝒑𝒐𝒔𝒊𝒃𝒍𝒆𝒔
𝑺𝑬(𝒑𝒓𝒐𝒎𝒆𝒅𝒊𝒐 𝒅𝒆 𝒅𝒖𝒎𝒎𝒎𝒚) =
𝝈
𝒏
=
𝑷𝑨(𝟏−𝑷𝑨)
𝒏
8. Error típico o Error estándar (SE)
II. ESTIMACIÓN POR INTERVALOS
SE(e): Desviación estándar del estimador e.
Estimador:
𝑺𝑬 (𝒑𝒓𝒐𝒎𝒆𝒅𝒊𝒐) =
𝒔
𝒏
=
𝒊∈𝑵(𝒙𝒊−𝒙)𝟐
𝒏−𝟏
𝒏
= 𝒊∈𝑵(𝒙𝒊−𝒙)𝟐
𝒏(𝒏−𝟏)
𝑺𝑬 (𝒑𝒓𝒐𝒎𝒆𝒅𝒊𝒐 𝒅𝒆 𝒅𝒖𝒎𝒎𝒎𝒚) =
𝒔
𝒏
=
𝒏𝒑𝑨(𝟏−𝒑𝑨)
𝒏−𝟏
𝒏
=
𝒏𝒑𝑨(𝟏−𝒑𝑨)
𝒏(𝒏−𝟏)
=
𝒑𝑨(𝟏−𝒑𝑨)
(𝒏−𝟏)
9. Nivel de Confianza
II. ESTIMACIÓN POR INTERVALOS
Probabilidad con la cual un intervalo de confianza
contiene a un parámetro poblacional.
Siendo [a,b] un intervalo para estimar el parámetro
𝜇, el nivel de confianza= ℙ[𝑎 ≤ 𝜇 ≤ 𝑏 ]
Ej. El porcentaje de chilenos que declara que
hay un partido político al cual se siente más
cercano que el resto, con 95% de confianza, está
entre 20% y 28%
10. Estimación intervalar
II. ESTIMACIÓN POR INTERVALOS
Estimar un parámetro poblacional mediante un
rango de valores que contiene al parámetro
poblacional con una probabilidad conocida.
Nivel de confianza
11. Probabilidad de error (a)
II. ESTIMACIÓN POR INTERVALOS
1-Nivel de Confianza. Es la probabilidad de que el
intervalo de confianza NO contenga el parámetro
poblacional.
Ej. El porcentaje de chilenos que declara que hay un
partido político al cual se siente más cercano que el
resto, con 95% de confianza, está entre 20% y 28%
12. Error de estimación (e)
II. ESTIMACIÓN POR INTERVALOS
Corresponde a la mitad de la amplitud del intervalo
de confianza.
Ej. El porcentaje de chilenos que declara que hay
un partido político al cual se siente más cercano
que el resto, con 95% de confianza, está entre 20%
y 28%
Siendo [a,b] un intervalo y siendo 𝑥 el estimador
puntal del intervalo a estimar a= 𝑥 − e y b= 𝑥 + e
13. Conceptos de error
• Probabilidad de error: 1 – Nivel de de confianza
• Error de estimación (e):
• Error típico o error estándar
II. ESTIMACIÓN POR INTERVALOS
a= 𝑥 − e y b= 𝑥 + e
14. 1. Un estudio pretendía determinar qué estimador era más conveniente usar para analizar la edad de
los chilenos. Para ello generó 20 muestras de 100 casos cada una, y para cada muestra calculó 4
estimadores distintos. Los gráficos siguientes muestran la distribución de dichos estimadores en las
muestras. Sabiendo que el promedio de edad de los chilenos es 47 años, si usted quisiere usar uno de
los indicadores para realizar una estimación puntual ¿Cuál indicador recomendaría usar y por qué?
2. En una investigación utilizaron una muestra para estimar un intervalo de confianza de la altura de las
mujeres chilenas (en cms.), encontrando un intervalo = 158; 178 , utilizando 99% de Confianza .
¿Qué quiere decir ese resultado? ¿Cuál es la probabilidad de error? ¿Cuán es el error de estimación?
PREGUNTAS
15. II. Distribución muestral de
medias, Teorema Central del
Límite (TCL) y Ley de los grandes
números (LGN)
16. Distribución muestral de estimador
Distribución del estimador (estima un parámetro
poblacional)
III. DISTRIBUCIÓN MUESTAL DE MEDIAS, TCL Y LGN
0
2
4
6
8
10
12
14
20.08
20.1
20.12
20.14
20.16
20.18
20.2
20.22
20.24
20.26
20.28
20.3
20.32
20.34
20.36
20.38
20.4
20.42
20.44
20.46
𝜇
17. Distribución muestral de medias
Distribución del promedio muestral (estimador de un
promedio poblacional)
III. DISTRIBUCIÓN MUESTAL DE MEDIAS, TCL Y LGN
0
2
4
6
8
10
12
14
20.08
20.1
20.12
20.14
20.16
20.18
20.2
20.22
20.24
20.26
20.28
20.3
20.32
20.34
20.36
20.38
20.4
20.42
20.44
20.46
𝜇
18. Intervalos de Confianza
• Intervalo de un X% de Confianza: Rango de valores
que contiene al parametro poblacional con un X%
de probabilidad.
• Formas de estimar Intervalos de Confianza (IC)
– IC Exactos
– Aproximaciones asintóticas (Por TCL y LGN)
– Boostraping (Método de Boostrap)
III. DISTRIBUCIÓN MUESTAL DE MEDIAS, TCL Y LGN
19. Teorema central del límite
• La distribución de las medias muestrales extraídas
de forma aleatoria se aproximan a una distribución
normal para n suficientemente grandes.
¿Cuánto es suficientemente grande?
19
III. DISTRIBUCIÓN MUESTAL DE MEDIAS, TCL Y LGN
20. 0
.5
1
2 2.5 3 3.5 4
unif
0
.5
1
1.5
2
Density
19 19.5 20 20.5
norm
0
2.0e-04
4.0e-04
6.0e-04
Density
0 1000 2000 3000 4000
exp
n=30
20
III. DISTRIBUCIÓN MUESTAL DE MEDIAS, TCL Y LGN
Teorema central del límite
21. n=100
0
.5
1
1.5
2
2.4 2.6 2.8 3 3.2 3.4
unif
0
1
2
3
4
Density
19.6 19.8 20 20.2 20.4
norm
0
2.0e-04
4.0e-04
6.0e-04
8.0e-04
.001
Density
1500 2000 2500 3000 3500
exp
21
III. DISTRIBUCIÓN MUESTAL DE MEDIAS, TCL Y LGN
Teorema central del límite
22. n=500
0
1
2
3
4
5
2.8 2.9 3 3.1 3.2
uniform
0
2
4
6
8
Density
19.8 19.9 20 20.1 20.2
normal
0
5.0e-04
.001
.0015
.002
Density
1800 2000 2200 2400 2600 2800
exp
22
III. DISTRIBUCIÓN MUESTAL DE MEDIAS, TCL Y LGN
Teorema central del límite
23. Ley de los grandes números (LGN)
Los promedios de muestras aleatorias convergen en
probabilidad al parámetro poblacional.
23
III. DISTRIBUCIÓN MUESTAL DE MEDIAS, TCL Y LGN
24. Aproximaciones Asintóticas
• IC= tal que: P(a≤≤b)=NC
• P(-Za/2 ≤ (X-)/SE(X) ≤ Za/2)=NC
IV. CONSTRUCCIÓN DE INTERVALOS DE CONFIANZA
+ TCL + LGN = Fórmula IC
25. Aproximaciones Asintóticas
IV. CONSTRUCCIÓN DE INTERVALOS DE CONFIANZA
𝑺𝑬 (𝒙) = 𝒊∈𝒏(𝒙𝒊−𝒙)𝟐
𝒏(𝒏−𝟏)
𝑺𝑬 (𝒑) =
𝒑(𝟏 − 𝒑)
(𝒏 − 𝟏)
Za/2:
95% Confianza: 1,96
99% de Confianza: 2,58
26. Error de estimación (e)
II. ESTIMACIÓN POR INTERVALOS
Corresponde a la mitad de la amplitud del intervalo
de confianza.
Siendo [a,b] un intervalo y siendo 𝑥 el estimador
puntal del intervalo a estimar a= 𝑥 − e y b= 𝑥 + e
e e
27. Aproximaciones Asintóticas
• Ejemplo: En una muestra de 1000 estudiantes de la
FACSO, el 30% de ellos fuma. Estime la proporción
de estudiantes de la FACSO que fuman, usando
estimación por intervalos con un 95% de
Confianza.
• Za/2:
95% Confianza: 1,96
99% de Confianza: 2,58
IV. CONSTRUCCIÓN DE INTERVALOS DE CONFIANZA
𝑺𝑬 (𝒑) =
𝒑(𝟏 − 𝒑)
(𝒏 − 𝟏)
28. Aproximaciones Asintóticas
• Ejemplo: En una muestra de 1000 estudiantes de la
FACSO, el promedio de edad es 22,7 y la varianza
es 4,9. Estime el promedio de edad de estudiantes
de la FACSO, usando estimación por intervalos con
un 99% de Confianza.
• Za/2:
95% Confianza: 1,96
99% de Confianza: 2,58
IV. CONSTRUCCIÓN DE INTERVALOS DE CONFIANZA
𝑺𝑬 (𝒙) = 𝒊∈𝒏(𝒙𝒊−𝒙)𝟐
𝒏(𝒏−𝟏)
32. Intervalos de Confianza
• Intervalo de un X% de Confianza: Rango de valores
que contiene al parametro poblacional con un X%
de probabilidad.
• Formas de estimar Intervalos de Confianza (IC)
– IC Exactos
– Aproximaciones asintóticas (Por TCL y LGN)
– Boostraping (Método de Boostrap)
IV. CONSTRUCCIÓN DE INTERVALOS DE CONFIANZA
34. Mayor Nivel de Confianza (NC) Menor precisión.
Nivel de Confianza
V. DETERMINANTES DE LA PRECISIÓN DEL IC
𝑺𝑬 (𝒙) =
𝒏
𝒏(𝒏−𝟏)
𝑺𝑬 (𝒑) =
𝒑(𝟏 − 𝒑)
(𝒏 − 𝟏)
35. Tamaño de la muestra (n)
V. DETERMINANTES DE LA PRECISIÓN DEL IC
𝑺𝑬 (𝒙) = 𝒊∈𝒏(𝒙𝒊−𝒙)𝟐
𝒏(𝒏−𝟏)
𝑺𝑬 (𝒑) =
𝒑(𝟏 − 𝒑)
(𝒏 − 𝟏)
Mayor Tamaño muestral (n) Menor SE Mayor
precisión.
36. 𝑺𝑬 (𝒑) =
𝒏𝒑(𝟏 − 𝒑)
𝒏(𝒏 − 𝟏)
Varianza
V. DETERMINANTES DE LA PRECISIÓN DEL IC
𝑺𝑬 (𝒙) = 𝒊∈𝒏(𝒙𝒊−𝒙)𝟐
𝒏(𝒏−𝟏)
Mayor Varianza Mayor SE Menor precisión.
37. 𝑺𝑬 (𝒑) =
𝒑(𝟏 − 𝒑)
(𝒏 − 𝟏)
Error de estimación
V. DETERMINANTES DE LA PRECISIÓN DEL IC
𝑺𝑬 (𝒙) = 𝒊∈𝒏(𝒙𝒊−𝒙)𝟐
𝒏(𝒏−𝟏)
Mayor error de estimación Menor precisión.
38. 3. Considere los siguientes datos para calcular un intervalo de confianza con un 90% de confianza que
indique la proporción de estudiantes de derecha de la facultad. Interprete sus resultados estadística y
sociológicamente.
4. Considere los siguientes datos para calcular un intervalo de confianza
con un 90% de confianza que indique el promedio PSU de los estudiantes
de la facultad. Interprete sus resultados estadística y sociológicamente.
5. La proporción de personas con enseñanza básica
completa en una población corresponde a un 90%.
Un grupo de investigadores, que no conocían el
parámetro poblacional realizaron 2 muestras de la
población y a partir de cada una de ellas estimaron
un intervalo de confianza para la proporción de
personas de la población con enseñanza básica.
El intervalo construido a partir de la muestra 1
corresponde a [84%, 99%], y el de la muestra 2
corresponde a [89%, 94%]. ¿Qué motivos podrían
explicar que el intervalo de la muestra 2 sea más
preciso?
PREGUNTAS
Tamaño de la muestra 1000
% de estudiantes de derecha en la muestra 25%
Promedio PSU estudiantes de la muestra 708
Varianza muestral PSU 56
44. Contenidos
I. Estimación puntual.
II. Estimación por Intervalos: Conceptos de error
típico, nivel de confianza y error de estimación.
III. Distribución muestral de medias, Teorema
Central del límite, Ley de los grandes números.
IV. Construcción de intervalos de confianza.
V. Determinantes de la precisión de los intervalos
de confianza.
VI. Ejemplos
INTRODUCCIÓN
45. CONCEPTOS FUNDAMENTALES
• Estimación puntual
• Estimación por intervalos
• Error estándar
• Nivel de confianza
• Probabilidad de error
• Error de estimación
• Teorema Central del Límite
• Ley de los Grandes números
• Distribución muestral de
medias