1. Carmen Cortés Parejo
Tema 4: Intervalos de confianza
INFERENCIA ESTADÍSTICA:
El objetivo será hacer estimaciones de los parámetros (media, varianza, …) de una población (variable) a partir de las
observaciones en las muestras.
Consideramos una variable 𝑋 de parámetros 𝜇 y 𝜎. Vamos a ir tomando muestras de tamaño 𝒏 de la variable. Para cada
una de ellas, su media ҧ
𝑥 y su varianza 𝑠2
serán estimaciones de la media 𝜇 y la varianza 𝜎2
de la población 𝑋.
Muestra 1: 𝑥1
1
𝑥2
1
𝑥3
1
… 𝑥𝑛−1
1
𝑥𝑛
1
Muestra 2: 𝑥1
2
𝑥2
2
𝑥3
2
… 𝑥𝑛−1
2
𝑥𝑛
2 ҧ
𝑥2 𝑠2
2
Muestra 3: 𝑥1
3
𝑥2
3
𝑥3
3
… 𝑥𝑛−1
3
𝑥𝑛
3 ҧ
𝑥3 𝑠3
2
ҧ
𝑥1 𝑠1
2
Media
muestral
Varianza
muestral
𝑋2
𝑋𝑖 ≡ 𝑖 − é𝑠𝑖𝑚𝑎𝑠 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖𝑜𝑛𝑒𝑠 𝑑𝑒 𝑙𝑎𝑠 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑠 𝑑𝑒 𝑡𝑎𝑚𝑎ñ𝑜 𝑛 𝑑𝑒 𝑋
𝑷𝒂𝒓𝒂 𝒊 = 𝟏, … , 𝒏:
𝑋𝑖 𝑡𝑖𝑒𝑛𝑒 𝑙𝑎 𝑚𝑖𝑠𝑚𝑎 𝑚𝑒𝑑𝑖𝑎 μ 𝑦 𝑙𝑎 𝑚𝑖𝑠𝑚𝑎 𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝜎2
𝑞𝑢𝑒 𝑋
𝑋1 𝑋3 𝑋𝑛−1 𝑋𝑛
2. Carmen Cortés Parejo
Tema 4: Intervalos de confianza
Consideramos una variable 𝑋 de parámetros 𝜇 y 𝜎.
𝑋𝑖 ≡ 𝑖 − é𝑠𝑖𝑚𝑎𝑠 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖𝑜𝑛𝑒𝑠 𝑑𝑒 𝑙𝑎𝑠 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑠 𝑑𝑒 𝑡𝑎𝑚𝑎ñ𝑜 𝑛 𝑑𝑒 𝑋, 𝑝𝑎𝑟𝑎 𝑖 = 1, … , 𝑛.
Variable media muestral:
ത
𝑋 =
𝑋1 + 𝑋2 + ⋯ + 𝑋𝑛
𝑛
Toma como valores las medias de las muestras de tamaño n: ҧ
𝑥1, ҧ
𝑥2, ҧ
𝑥3, …
Variable varianza muestral:
𝑆2
=
(𝑋1− ത
𝑋)2 + (𝑋2− ത
𝑋)2 + ⋯ + (𝑋𝑛− ത
𝑋)2
𝑛
Toma como valores las varianzas de las muestras de tamaño n: 𝑠1
2
, 𝑠2
2
, 𝑠3
2
, …
5. Carmen Cortés Parejo
Tema 4: Intervalos de confianza
Consideramos una variable 𝑋 de parámetros 𝜇 y 𝜎.
𝑋𝑖 ≡ 𝑖 − é𝑠𝑖𝑚𝑎𝑠 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖𝑜𝑛𝑒𝑠 𝑑𝑒 𝑙𝑎𝑠 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑠 𝑑𝑒 𝑡𝑎𝑚𝑎ñ𝑜 𝑛 𝑑𝑒 𝑋, 𝑝𝑎𝑟𝑎 𝑖 = 1, … , 𝑛.
Estadístico: Cualquier variable definida a partir de las 𝑋𝑖.
ത
𝑋 =
𝑋1 + 𝑋2 + ⋯ + 𝑋𝑛
𝑛
𝑆2
=
(𝑋1− ത
𝑋)2
+ (𝑋2− ത
𝑋)2
+ ⋯ + (𝑋𝑛− ത
𝑋)2
𝑛
Ejemplos:
Estimador: Estadístico que se utiliza para estimar algún parámetro de la población (variable) 𝑋.
Ejemplos: ത
𝑋 es un estimador de 𝜇 y 𝑆2
es un estimador de 𝜎2
.
Estimador insesgado: Su esperanza matemática coincide con el valor del parámetro que estima.
Estimador sesgado: Su esperanza matemática no coincide con el valor del parámetro que estima.
6. Carmen Cortés Parejo
Tema 4: Intervalos de confianza
Ejemplo 1: ത
𝑋 es un estimador insesgado de 𝜇 porque vimos que 𝐸 ത
𝑋 = 𝜇.
Ejemplo 2: 𝑆2 es un estimador sesgado de 𝜎2 porque puede comprobarse que 𝐸 𝑆2 =
𝑛−1
𝑛
∙ 𝜎2 ≠ 𝜎2.
Ejemplo 3:
Si definimos la variable CUASI-VARIANZA MUESTRAL como መ
𝑆2
=
𝑛
𝑛−1
𝑆2
se tiene que la cuasi-varianza muestral es un
estimador insesgado de 𝜎2 ya que:
𝐸 መ
𝑆2 = 𝐸
𝑛
𝑛 − 1
𝑆2 =
𝑛
𝑛 − 1
𝐸 𝑆2 =
𝑛
𝑛 − 1
∙
𝑛 − 1
𝑛
∙ 𝜎2 = 𝜎2
Nos ayudaremos de ciertos estimadores para calcular estimaciones de algunos parámetros de las poblaciones.
7. Carmen Cortés Parejo
Tema 4: Intervalos de confianza
Un intervalo de confianza [𝒂, 𝒃] para un parámetro de una población es un par de números entre los cuales se estima
que estará el parámetro con un determinado nivel de confianza p prefijado de antemano. Este intervalo se calcula a
partir de los datos de una muestra. El nivel de confianza representa el porcentaje de intervalos construidos a partir de
100 muestras independientes distintas que contienen al parámetro.
INTERVALOS DE CONFIANZA:
Nivel de confianza p:
𝑝 ∈ 0,1 (es una probabilidad)
𝑝 ↑↑ 1
𝑝~0.975, 0.95, 0.999
Amplitud del intervalo de confianza: 𝑏 − 𝑎
Margen de error cometido en la aproximación:
𝑏−𝑎
2
A veces es conveniente expresar el nivel de confianza como 𝒑 = 𝟏 − 𝜶, siendo 𝛼 ∈ 0,1 ,
lo que se conoce como nivel de significación.
11. Carmen Cortés Parejo
Tema 4: Intervalos de confianza
INTERVALO DE CONFIANZA PARA 𝝁 CON 𝝈 CONOCIDA
ҧ
𝑥 −
𝜎
𝑛
∙ 𝑧1−
𝛼
2
; ҧ
𝑥 +
𝜎
𝑛
∙ 𝑧1−
𝛼
2
ҧ
𝑥
ҧ
𝑥 +
𝜎
𝑛
∙ 𝑧1−
𝛼
2
ҧ
𝑥 −
𝜎
𝑛
∙ 𝑧1−
𝛼
2
Error =
𝝈
𝒏
∙ 𝒛𝟏−
𝜶
𝟐
12. Carmen Cortés Parejo
Tema 4: Intervalos de confianza
DISTRIBUCIÓN t de STUDENT:
Dadas 𝑌, 𝑋1, … , 𝑋𝑛 variables independientes normales 𝑁(0,1),
la distribución t de Student con n grados de libertad se define
como:
𝑡𝑛 =
𝑌
1
𝑛
σ 𝑋𝑖
2
𝑡𝑛,𝑝
𝑝
𝑡𝑛
Tabla: Dados 𝑛 (grados de libertad)
y 𝑝 (probabilidad) la tabla nos
proporciona el valor 𝑡𝑛,𝑝 tal que:
𝑃 𝑡𝑛 ≤ 𝑡𝑛,𝑝 = 𝑝
𝑡9,0.975 = 2.2622
Esto quiere decir que dada una 𝑡9, el
valor que deja a su izquierda un
área encerrada de 0.975 es 2.2622.
𝑃 𝑡9 ≤ 2.2622 = 0.975
13. Carmen Cortés Parejo
Tema 4: Intervalos de confianza
DISTRIBUCIÓN t de STUDENT:
Dadas 𝑌, 𝑋1, … , 𝑋𝑛 variables independientes normales 𝑁(0,1),
la distribución t de Student con n grados de libertad se define
como:
𝑡𝑛 =
𝑌
1
𝑛
σ 𝑋𝑖
2
𝑡𝑛,𝑝
𝑝
𝑡𝑛
Tabla: Dados 𝑛 (grados de libertad)
y 𝑝 (probabilidad) la tabla nos
proporciona el valor 𝑡𝑛,𝑝 tal que:
𝑃 𝑡𝑛 ≤ 𝑡𝑛,𝑝 = 𝑝
𝑡59,0.99 = 2.3901
~ 𝑡60,0.99
14. Carmen Cortés Parejo
Tema 4: Intervalos de confianza
2.- INTERVALO DE CONFIANZA PARA 𝝁 CON 𝝈 DESCONOCIDA
Partiremos de:
𝑋 variable aleatoria con media 𝜇 desconocida y desviación típica 𝜎 desconocida.
Una muestra de 𝑋 de tamaño 𝑛 de la que conocemos su media ҧ
𝑥 y su desviación típica 𝑠.
Un nivel de confianza 𝑝 = 1 − 𝛼.
ҧ
𝑥 − 𝑡𝑛−1;1−
𝛼
2
∙
𝑠
𝑛 − 1
; ҧ
𝑥 + 𝑡𝑛−1;1−
𝛼
2
∙
𝑠
𝑛 − 1
Intervalo:
⟹ ҧ
𝑥 ± 𝑡𝑛−1;1−
𝛼
2
∙
𝑠
𝑛 − 1
ത
𝑋 − 𝜇
ൗ
𝑆
𝑛 − 1
=
ത
𝑋 − 𝜇
൘
መ
𝑆
𝑛
~𝑡𝑛−1
Estadístico:
𝑆 ≡ 𝑉𝑎𝑟𝑖𝑎𝑏𝑙𝑒 𝐷𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛 𝑇í𝑝𝑖𝑐𝑎 𝑀𝑢𝑒𝑠𝑡𝑟𝑎𝑙 (𝑟𝑎í𝑧 𝑑𝑒 𝑙𝑎 𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙)
መ
𝑆 ≡ 𝑉𝑎𝑟𝑖𝑎𝑏𝑙𝑒 𝐶𝑢𝑎𝑠𝑖 − 𝐷𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛 𝑇í𝑝𝑖𝑐𝑎 𝑀𝑢𝑒𝑠𝑡𝑟𝑎𝑙
15. Carmen Cortés Parejo
Tema 4: Intervalos de confianza
DISTRIBUCIÓN 𝝌𝟐
de PEARSON:
Dadas 𝑋1, … , 𝑋𝑛 variables independientes normales 𝑁(0,1), la
distribución 𝝌𝟐
de Pearson con n grados de libertad se define
como:
𝜒𝑛
2 = 𝑋𝑖
2
= 𝑋1
2
+ ⋯ + 𝑋𝑛
2
𝜒𝑛,𝑝
2
𝜒𝑛
2
𝑝
Tabla: Dados 𝑛 (grados de libertad)
y 𝑝 (probabilidad) la tabla nos
proporciona el valor 𝜒𝑛,𝑝
2 tal que:
𝑃 𝜒𝑛
2
≤ 𝜒𝑛,𝑝
2
= 𝑝
𝜒7,0.95
2
𝑃 𝜒7
2
≤ = 14.1
Esto quiere decir que dada una 𝜒7
2
,
el valor que deja a su izquierda un
área encerrada de 0.95 es 14.1.
16. Carmen Cortés Parejo
Tema 4: Intervalos de confianza
3.- INTERVALO DE CONFIANZA PARA 𝝈𝟐
Partiremos de:
𝑋 variable aleatoria con desviación típica 𝜎 desconocida.
Una muestra de 𝑋 de tamaño 𝑛 de la que conocemos su desviación típica 𝑠.
Un nivel de confianza 𝑝 = 1 − 𝛼.
𝑛𝑆2
𝜎2
=
(𝑛 − 1) መ
𝑆2
𝜎2
~𝜒𝑛
2
Estadístico:
1-
𝑛𝑠2
𝜒
𝑛−1;1−
𝛼
2
2 ,
𝑛𝑠2
𝜒
𝑛−1;
𝛼
2
2
Intervalo:
3(BIS).- INTERVALO DE CONFIANZA PARA 𝝈
1-
𝑛𝑠2
𝜒
𝑛−1;1−
𝛼
2
2 ,
𝑛𝑠2
𝜒
𝑛−1;
𝛼
2
2
17. Carmen Cortés Parejo
Tema 4: Intervalos de confianza
4.- INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS CON DESVIACIONES TÍPICAS CONOCIDAS
Partiremos de:
Dos variables aleatorias: 𝑋𝑖~𝑁(𝜇𝑖, 𝜎𝑖) con 𝜎𝑖 conocida, para 𝑖 = 1,2.
Dos muestras: Muestra de tamaño 𝑛𝑖 de la variable 𝑋𝑖, con media ҧ
𝑥𝑖, para 𝑖 = 1,2.
Un nivel de confianza 𝑝 = 1 − 𝛼.
Estadístico: ത
𝑋1 − ത
𝑋2~𝑁 𝜇1 − 𝜇2,
𝜎1
2
𝑛1
+
𝜎2
2
𝑛2
( ҧ
𝑥1− ҧ
𝑥2) − 𝑧1−
𝛼
2
∙
𝜎1
2
𝑛1
+
𝜎2
2
𝑛2
; ( ҧ
𝑥1− ҧ
𝑥2) + 𝑧1−
𝛼
2
∙
𝜎1
2
𝑛1
+
𝜎2
2
𝑛2
Intervalo:
⟹ ( ҧ
𝑥1− ҧ
𝑥2) ± 𝑧1−
𝛼
2
∙
𝜎1
2
𝑛1
+
𝜎2
2
𝑛2
Si el intervalo de confianza contiene al cero,
se concluye que hay similitud entre las medias
de ambas variables.
18. Carmen Cortés Parejo
Tema 4: Intervalos de confianza
5.- INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS CON DESVIACIONES TÍPICAS DESCONOCIDAS PERO IGUALES
Partiremos de:
Dos variables aleatorias: 𝑋𝑖~𝑁(𝜇𝑖, 𝜎𝑖, ) para 𝑖 = 1,2, con 𝜎1 = 𝜎2 desconocidas.
Dos muestras: Muestra de tamaño 𝑛𝑖 de la variable 𝑋𝑖, con media ҧ
𝑥𝑖 y varianza 𝑠𝑖
2
, para 𝑖 = 1,2.
Un nivel de confianza 𝑝 = 1 − 𝛼.
Estadístico:
ത
𝑋1 − ത
𝑋2 − (𝜇1 − 𝜇2)
መ
𝑆𝑇
1
𝑛1
+
1
𝑛2
~ 𝑡𝑛1+𝑛2−2
( ҧ
𝑥1− ҧ
𝑥2) − 𝑡𝑛1+𝑛2−2;1−
𝛼
2
∙ መ
𝑆𝑇 ∙
1
𝑛1
+
1
𝑛2
; ( ҧ
𝑥1− ҧ
𝑥2) + 𝑡𝑛1+𝑛2−2;1−
𝛼
2
∙ መ
𝑆𝑇 ∙
1
𝑛1
+
1
𝑛2
⟹
Intervalo:
⟹ ( ҧ
𝑥1− ҧ
𝑥2) ± 𝑡𝑛1+𝑛2−2;1−
𝛼
2
∙ መ
𝑆𝑇 ∙
1
𝑛1
+
1
𝑛2
መ
𝑆𝑇 =
𝑛1𝑠1
2
+ 𝑛2𝑠2
2
𝑛1 + 𝑛2 − 2
19. Carmen Cortés Parejo
Tema 4: Intervalos de confianza
6.- INTERVALO DE CONFIANZA PARA LA PROPORCIÓN 𝑷 DE UNA CARACTERÍSTICA EN UNA POBLACIÓN
Partiremos de:
𝑋 variable aleatoria.
Una muestra de 𝑋 de tamaño 𝑛 de la que conocemos la proporción 𝑝0 de la característica.
Un nivel de confianza 𝑝 = 1 − 𝛼.
Estadístico: 𝑃0~𝑁 𝑃,
𝑃(1 − 𝑃)
𝑛
INTERVALO DE CONFIANZA PARA 𝑷:
𝑝0 − 𝑧1−
𝛼
2
𝑝0 1 − 𝑝0
𝑛
; 𝑝0 + 𝑧1−
𝛼
2
𝑝0(1 − 𝑝0)
𝑛
⟹ 𝑝0 ± 𝑧1−
𝛼
2
𝑝0(1 − 𝑝0)
𝑛
20. Carmen Cortés Parejo
Tema 4: Intervalos de confianza
PROBLEMA: Determinar el tamaño muestral 𝒏 para determinar un intervalo de confianza para la proporción 𝑷 con un
error menor que 𝜺 sin conocer la proporción 𝒑𝟎 en una muestra.
Partiremos de:
𝑋 variable aleatoria.
Una muestra de 𝑋 de tamaño 𝑛 de la que conocemos la proporción 𝑝0 de la característica.
Un nivel de confianza 𝑝 = 1 − 𝛼.
𝑝0 ± 𝑧1−
𝛼
2
𝑝0(1 − 𝑝0)
𝑛
𝐸𝑟𝑟𝑜𝑟
INTERVALO PARA 𝑷:
𝐿𝑎 𝑓𝑢𝑛𝑐𝑖ó𝑛 𝑓 𝑥 = 𝑥 ∙ 1 − 𝑥 𝑎𝑙𝑐𝑎𝑛𝑧𝑎 𝑠𝑢 𝑚á𝑥𝑖𝑚𝑜 𝑒𝑛 𝑥 =
1
2
⟹ 𝑓 𝑥0 ≤ 𝑓
1
2
𝑝𝑎𝑟𝑎 𝑐𝑢𝑎𝑙𝑞𝑢𝑖𝑒𝑟 𝑥0 ∈ ℝ
⟹ 𝑥0 ∙ (1 − 𝑥0) ≤ 0.5 ∙ 1 − 0.5 ⟹ 𝑥0 ∙ (1 − 𝑥0) ≤ 0.52
𝑬𝒓𝒓𝒐𝒓 = 𝑧1−
𝛼
2
𝑝0(1 − 𝑝0)
𝑛
≤ 𝑧1−
𝛼
2
0.52
𝑛
𝐷𝑒𝑠𝑝𝑒𝑗𝑎𝑚𝑜𝑠 𝑛
≤ 𝜀
𝐿𝑜 𝑖𝑚𝑝𝑜𝑛𝑒𝑚𝑜𝑠