2. Logro
Importancia
Al término de la unidad, el estudiante utiliza los diferentes tipos
de distribuciones, modelos de estimación de parámetro puntual
y por intervalos, y los tipos de muestreo para determinar el
tamaño de la muestra en un contexto de investigación
científica.
Es importa describir las características generales de un universo
de estudio, pero sin la necesidad de realizar el registro de datos
a todos los elementos o unidades del conjunto o población, sino
solo a una parte de esta llamada muestra, lo que permite
economizar tiempo y dinero.
7. Métodos de estimación:
Estimación puntual:
utilización de datos de la
muestra para calcular un
solo número para estimar el
parámetro de interés.
Estimación de intervalo:
ofrece un intervalo de valores
razonables dentro del cual se
pretende que esté el parámetro
de interés: θ(𝜇𝜇, 𝜎𝜎, 𝜋𝜋)
Estadística Inferencial
La inferencia estadística comprende
1. La estimación de parámetros (Estimación puntual y por intervalos)
2. Prueba de Hipótesis
11. En lugar de indicar simplemente un único valor como
estimación del parámetro poblacional θ(𝜇𝜇, 𝜎𝜎, 𝜋𝜋), lo que se hace
es calcular un intervalo de valores en el que se tiene cierta
probabilidad (confianza) de que se encuentre el verdadero
valor de θ.
Estadística Inferencial
Estimación por intervalo de confianza
Coeficiente
o grado de
confianza
𝑃𝑃( ̂
𝜃𝜃 − 𝜀𝜀 < 𝜃𝜃 < ̂
𝜃𝜃 + 𝜀𝜀) = 1 − 𝛼𝛼
Es decir, se puede garantizar con una probabilidad de 1-𝛼𝛼 que
la muestra elegida contendrá el valor verdadero(𝜇𝜇, 𝜎𝜎, 𝜋𝜋)
𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷(𝒑𝒑): 𝐸𝐸𝐸𝐸 =
𝑃𝑃(1 − 𝑃𝑃)
𝑛𝑛
𝑴𝑴𝑴𝑴𝑴𝑴𝑴𝑴𝑴𝑴( �
𝑋𝑋): 𝐸𝐸𝐸𝐸 =
𝑆𝑆
𝑛𝑛
𝜀𝜀: (Error Estándar= EE)
13. µ
Al calcular un intervalo de confianza
al 95%, ello quiere decir que el 95%
de las veces que repitamos el
proceso de muestreo (y calculemos
el estadístico), el verdadero valor del
parámetro poblacional θ (𝜇𝜇, 𝜎𝜎, 𝜋𝜋)
estará dentro de tal intervalo.
Estadística Inferencial
Estimación por intervalo de confianza
Intervalo de confianza para una media población (𝝁𝝁)
1 − 𝛼𝛼 = 95%, 90%, 99%
Interpretación
𝑴𝑴𝑴𝑴𝑴𝑴𝑴𝑴𝑴𝑴( �
𝑋𝑋): 𝐸𝐸𝐸𝐸 =
𝑆𝑆
𝑛𝑛
𝑴𝑴𝑴𝑴𝑴𝑴𝑴𝑴𝑴𝑴( �
𝑋𝑋): 𝐸𝐸𝐸𝐸 =
𝑆𝑆
𝑛𝑛
�
𝑁𝑁 − 𝑛𝑛
𝑁𝑁 − 1
14. 𝑍𝑍𝛼𝛼
2
𝑍𝑍1−
𝛼𝛼
2
�
𝛼𝛼
2 �
𝛼𝛼
2
1 − 𝛼𝛼
𝑃𝑃 −𝑍𝑍1−
𝛼𝛼
2
≤
̅
𝑥𝑥 − 𝜇𝜇
⁄
𝜎𝜎 𝑛𝑛
≤ 𝑍𝑍1−
𝛼𝛼
2
= 1 − 𝛼𝛼
𝑃𝑃 ̅
𝑥𝑥 − 𝑍𝑍1−
𝛼𝛼
2
�
𝜎𝜎
𝑛𝑛
≤ 𝜇𝜇 ≤ ̅
𝑥𝑥 + 𝑍𝑍1−
𝛼𝛼
2
�
𝜎𝜎
𝑛𝑛
= 1 − 𝛼𝛼
Coeficiente
o grado de
confianza
Estadística Inferencial
Estimación por intervalo de confianza
Intervalo de confianza para
una media población (𝝁𝝁)
15. 𝑃𝑃( ̂
𝜃𝜃 − 𝜀𝜀 < 𝜃𝜃 < ̂
𝜃𝜃 + 𝜀𝜀) = 1 − 𝛼𝛼
Estadística Inferencial
Estimación Por intervalo
Intervalo de confianza para una media población (𝝁𝝁)
𝑪𝑪𝑪𝑪𝑪𝑪𝑪𝑪 𝟏𝟏: Tamaño de la muestra 𝑛𝑛 ≥ 30
IC 𝜇𝜇 = �
𝑋𝑋 ± 𝑍𝑍 1−
𝛼𝛼
2
⋅
𝜎𝜎
𝑛𝑛
)
𝐼𝐼𝐼𝐼(𝜇𝜇 = �
𝑿𝑿 − 𝑍𝑍 1−
𝛼𝛼
2
⋅
𝜎𝜎
𝑛𝑛
𝐿𝐿𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖
≤ 𝜇𝜇 ≤ �
𝑿𝑿 + 𝑍𝑍 1−
𝛼𝛼
2
⋅
𝜎𝜎
𝑛𝑛
𝐿𝐿𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆
IC 𝜇𝜇 = �
𝑋𝑋 ± 𝑍𝑍 1−
𝛼𝛼
2
⋅
𝑆𝑆
𝑛𝑛
Simplificado
ó
16. IC 𝜇𝜇 = �
𝑋𝑋 − 𝑇𝑇 1−
𝛼𝛼
2
,𝑛𝑛−1
⋅
𝑆𝑆
𝑛𝑛
≤ 𝜇𝜇 ≤ �
𝑋𝑋 + 𝑇𝑇 1−
𝛼𝛼
2
,𝑛𝑛−1
⋅
𝑆𝑆
𝑛𝑛
IC 𝜇𝜇 = �
𝑋𝑋 ± 𝑇𝑇 1−
𝛼𝛼
2
,𝑛𝑛−1
⋅
𝑆𝑆
𝑛𝑛
Estadística Inferencial
Estimación Por intervalo
Intervalo de confianza para una media población (𝝁𝝁)
𝑪𝑪𝑪𝑪𝑪𝑪𝑪𝑪 2: Tamaño de la muestra 𝑛𝑛 < 30
Simplificado
17. Estadística Inferencial
Estimación Por intervalo
Intervalo de confianza para una media población (𝝁𝝁)
Población Infinita
𝑴𝑴𝑴𝑴𝑴𝑴𝑴𝑴𝑴𝑴( �
𝑋𝑋): 𝐸𝐸𝐸𝐸 =
𝑆𝑆
𝑛𝑛
Población finita
𝑴𝑴𝑴𝑴𝑴𝑴𝑴𝑴𝑴𝑴( �
𝑋𝑋): 𝐸𝐸𝐸𝐸 =
𝑆𝑆
𝑛𝑛
�
𝑁𝑁 − 𝑛𝑛
𝑁𝑁 − 1
Nivel confianza 𝒁𝒁𝟏𝟏−
𝜶𝜶
𝟐𝟐
90% 1.645
95% 1.96
98% 2.33
99% 2.58
Paso 1: Leer detenidamente y encontrar la variable de interés
Paso 2: Identificar el tamaño de la muestra
Paso 3: Encontrar los datos (𝑛𝑛, �
𝑋𝑋, 𝜎𝜎 = �
𝜎𝜎 = 𝑆𝑆) y el nivel de confianza
18. Para un estudio ambiental, en una ciudad se toma una muestra aleatoria de 35 casas y se calcula que el peso medio
diario de basura producida es 3.160 kg. Por censos anteriores, se sabe que cada casa produce una cantidad de
basura que tiene una desviación estandar de 0.9 kg. halle un intervalo de confianza del 95% para el peso medio
total de basura producida por las casas de Lima. Asumir normalidad de la variable de interés.
𝑛𝑛 = 35
�
𝑋𝑋 = 3.160
Datos población
𝜎𝜎 = 0.9
Datos Muestra
IC 𝜇𝜇 = �
𝑋𝑋 ± 𝑍𝑍 1−
𝛼𝛼
2
⋅
𝜎𝜎
𝑛𝑛
Solución:
IC µ = 3.160 ± 1.96 ⋅
0.9
35
IC µ = 2.862 𝑘𝑘𝑘𝑘 ; 3.458 𝑘𝑘𝑘𝑘
Se tiene un nivel de confianza del 95% que el peso total promedio de
basura Producida en una casa durante un día esta en el intervalo
2.862 𝑘𝑘𝑘𝑘 ; 3.458 𝑘𝑘𝑘𝑘
𝑍𝑍
1−
0.05
2
𝑍𝑍 0.975 =1.96
Reemplazando
Estadística Inferencial
Estimación Por intervalo para media (𝝁𝝁𝟏𝟏): Ejercicio n>30
𝑁𝑁𝑁𝑁 = 1 − 𝛼𝛼 = 0.95
𝛼𝛼 = 0.05
𝑋𝑋:Peso de basura diario
19. Se hizo una investigación sobre el peso de una rara clase de tortugas en peligro de extinción en la selva del Perú. Se toma una
muestra de 20 especies, elegidos aleatoriamente, y se calculó un peso medio de 9.8525 kg y una desviación estándar de 0.0965.
Calcular un intervalo de confianza con un 95% para el verdadero peso medio de las tortugas en peligro de extinción.
𝑛𝑛 = 20
�
𝑋𝑋 = 9.8525
𝑆𝑆 = 0.0965
Datos población
𝑁𝑁𝑁𝑁 ℎ𝑎𝑎𝑎𝑎 𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑
Datos Muestra
Solución:
IC µ = 9.8525 ± 2.093 ⋅
0.0965
35
IC µ = 9.82 𝑘𝑘𝑘𝑘 , 9.89 𝑘𝑘𝑘𝑘
Se tiene un nivel de confianza del 95% que el verdadero peso
promedio de las tortugas en peligro de extinción se encuentra en el
intervalo 9.82 𝑘𝑘𝑘𝑘 9.89 𝑘𝑘𝑘𝑘
𝑇𝑇
1−
0.05
2
,𝑛𝑛−1
𝑇𝑇 0.975,19 =2.093
Reemplazando
IC 𝜇𝜇 = �
𝑋𝑋 ± 𝑇𝑇 1−
𝛼𝛼
2
,𝑛𝑛−1
⋅
𝑆𝑆
𝑛𝑛
𝑁𝑁𝑁𝑁 = 1 − 𝛼𝛼 = 0.95
𝛼𝛼 = 0.05
Estadística Inferencial
Estimación Por intervalo para media (𝝁𝝁𝟏𝟏): Ejercicio n<30
𝑋𝑋:Peso de una tortuga
22. Se desea estimar el peso medio de un lote de 10,000 muñecos navideños que un banco otorga a sus clientes. Para ello se
selecciona una muestra aleatoria de 41 muñecos, la cual da una media de 200 gramos. Calcule e interprete intervalos de
confianza del 95 % para el verdadero peso promedio. El proveedor de la totalidad de los muñecos estima que el peso medio tiene
una desviación estándar de 25 gramos
𝑛𝑛 = 41
�
𝑋𝑋 = 200
Datos población
𝑁𝑁 = 10000
𝜎𝜎 = 25
Datos Muestra
IC 𝜇𝜇 = �
𝑋𝑋 ± 𝑍𝑍 1−
𝛼𝛼
2
⋅
𝜎𝜎
𝑛𝑛
𝑁𝑁 − 𝑛𝑛
𝑁𝑁 − 1
Solución:
IC µ = 200 ± 1.96 ⋅
25
41
10000 − 41
10000 − 1
IC µ = 192.36 𝑘𝑘𝑘𝑘 ; 267.64 𝑘𝑘𝑘𝑘
Se tiene un nivel de confianza del 95% que el verdadero peso
promedio de los muñecos esta en el intervalo 192.36 𝑘𝑘𝑘𝑘 ; 267.64 𝑘𝑘𝑘𝑘
𝑍𝑍
1−
0.05
2
𝑍𝑍 0.975 =1.96
Reemplazando
𝑁𝑁𝑁𝑁 = 1 − 𝛼𝛼 = 0.95
𝛼𝛼 = 0.05
Estadística Inferencial
Estimación Por intervalo para media (𝝁𝝁𝟏𝟏): Ejercicio n>30, población finita
𝑋𝑋:Peso de un muñeco navideño
25. En un estudio para determinar el gasto medio mensual en arbitrios en las ciudades A y B, se toma una muestra
al azar de 200 hogares de A arrojando un gasto medio de S/. 250 y una desviación estándar de 15. Una muestra
al azar de 180 hogares de la ciudad B da una gasto medio de 235 y una desviación estándar de 10.
a) Determine un intervalo de confianza del 99 % para la diferencia del gasto medio en las ciudades A y B.
b) ¿Es diferente el gasto medio mensual en arbitrios en las ciudades A y B?
Datos población
𝑁𝑁𝑁𝑁 = 1 − 𝛼𝛼 = 0.99
𝛼𝛼 = 0.01
Datos Muestra
𝑍𝑍
1−
0.05
2
𝑍𝑍 0.995 =2.58
𝑋𝑋𝑋𝑋:Gasto medio mensual en arbitrios en las ciudades… A
𝑛𝑛1 = 200
�
𝑋𝑋1 = 250
𝑆𝑆1 = 15
B
𝑛𝑛2 = 180
�
𝑋𝑋2 = 235
𝑆𝑆2 = 10
IC 𝝁𝝁𝟏𝟏 − 𝝁𝝁𝟐𝟐 = 𝟐𝟐𝟓𝟓𝟓𝟓 − 𝟐𝟐𝟐𝟐𝟐𝟐 ± 2.58 �
152
200
+
102
180
⋅
11.66 ≤ 𝝁𝝁𝟏𝟏 − 𝝁𝝁𝟐𝟐 ≤ 18.34
Con el 99% de confianza, la diferencia del gasto medio mensual
en arbitrios en las ciudades A y B se encuentra entre S/. 11.66 y 18.34.
IC 𝝁𝝁𝟏𝟏 − 𝝁𝝁𝟐𝟐 = (�
𝑿𝑿𝟏𝟏−�
𝑿𝑿𝟐𝟐) ± 𝑍𝑍 1−
𝛼𝛼
2
𝑆𝑆1
2
𝑛𝑛1
+
𝑆𝑆2
2
𝑛𝑛2
No hay Datos
Estadística Inferencial
Estimación Por intervalo para media(𝝁𝝁𝟏𝟏 − 𝝁𝝁𝟐𝟐): Ejercicio
Solución a:
26. Responder a la pregunta ¿Es diferente el gasto medio mensual
en arbitrios en las ciudades A y B? implica responder si ¿ A ≠ B?
o también ¿A - B ≠ 0? Si apreciamos el intervalo de confianza
construido en
𝝁𝝁𝟏𝟏 − 𝝁𝝁𝟐𝟐 no puede ser cero, es decir, el gasto medio mensual
en arbitrios en ambas ciudades es diferente.
11.66 ≤ 𝝁𝝁𝟏𝟏 − 𝝁𝝁𝟐𝟐 ≤ 18.34
Si IC=(+,+), P(+ <µA - µB < +)=1-α
Si IC=(-,-), P(- < µA - µB < - )=1-α
Si IC=(-,+), P(- < µA - µB < +)=1-α
µA > µB
µA < µB
µA = µB
Estadística Inferencial
Estimación Por intervalo
Solución b:
27. Un alumno de la UTP en su tesis pretende comparar el
contenido de 𝐶𝐶𝐶𝐶2 que emanan 2 tipos de vehículos deportivos
nuevos (Speeddy, Correcaminos), para ello toma 10 muestras
en el primero y 8 en el segundo. En el primero encuentra un
contenido medio de 3.1 PPM y 2.7 PPM y una desviación
estandar de 0.5 y 0.7 respectivamente. Suponiendo que los
conjuntos de datos provienen de muestras tomadas al azar de
poblaciones normales con varianzas iguales, construya un
intervalo de confianza del 95% para la diferencia real de
contenido de 𝐶𝐶𝐶𝐶2.
Estimación Por intervalo para media(𝝁𝝁𝟏𝟏 − 𝝁𝝁𝟐𝟐): Ejercicio
Estadística Inferencial
28. Datos población
𝑁𝑁𝑁𝑁 ℎ𝑎𝑎𝑎𝑎 𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑
𝑁𝑁𝑁𝑁 = 1 − 𝛼𝛼 = 0.95
𝛼𝛼 = 0.05
Datos Muestra
𝑇𝑇
1−
0.05
2 ;𝑔𝑔𝑔𝑔
𝑇𝑇 0.975,16 =2.12
𝑋𝑋𝑋𝑋:contenido de 𝐶𝐶𝐶𝐶2 𝑞𝑞𝑞𝑞𝑞𝑞 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 𝑙𝑙𝑙𝑙𝑙𝑙 2 𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣
Speedy
𝑛𝑛1 = 10
�
𝑋𝑋1 = 3.1
𝑆𝑆1 = 0.5
Correcaminos
𝑛𝑛2 = 8
�
𝑋𝑋2 = 2.7
𝑆𝑆2 = 0.7
IC 𝝁𝝁𝟏𝟏 − 𝝁𝝁𝟐𝟐 = �
𝑿𝑿𝟏𝟏 −�
𝑿𝑿𝟐𝟐 ±𝑇𝑇 1−
𝛼𝛼
2
,𝐺𝐺𝐺𝐺
𝑆𝑆𝑃𝑃
2 1
𝑛𝑛1
+
1
𝑛𝑛2
IC 𝝁𝝁𝟏𝟏 − 𝝁𝝁𝟐𝟐 = 𝟑𝟑. 𝟏𝟏 − 𝟐𝟐. 𝟕𝟕 ± 2.12 � 0.355
1
10
+
1
8
gl=10+8−2=16
𝑆𝑆𝑃𝑃
2
=
�10 − 1)0.52
+ (8 − 1)0.72
10 + 8 − 2
𝑆𝑆𝑃𝑃
2
= 0.355
−0,199 ≤ 𝝁𝝁𝟏𝟏 − 𝝁𝝁𝟐𝟐 ≤ 0.99
Con el 95% de confianza, la verdadera diferencia media del contenido de
CO2 que eman los 2 vehiculos. encuentra entre -0.199 y 0.99.
Estadística Inferencial
Solución a:
29. En un estudio para determinar si hay diferencia en el salario
semanal de los hombres y las mujeres de una gran empresa se
toma una muestra de 18 hombres encontrándose un promedio
de S/. 420 y una desviación estándar de S/. 50, mientras que en
una muestra de 15 mujeres se encontró un promedio de S/.
360 y una desviación estándar de S/. 90. Se pide encontrar el
intervalo de confianza del 95% para la diferencia de los
salarios medios de hombres y mujeres.
En dicho país se sabe que los sueldos medios semanales tienen
una variabilidad diferente.
Estimación Por intervalo para media(𝝁𝝁𝟏𝟏 − 𝝁𝝁𝟐𝟐): Ejercicio
Estadística Inferencial
30. Datos población
𝜎𝜎1
2
≠ 𝜎𝜎2
2
𝑁𝑁𝑁𝑁 = 1 − 𝛼𝛼 = 0.95
𝛼𝛼 = 0.05
Datos Muestra
𝑇𝑇
1−
0.05
2 ;𝑔𝑔𝑔𝑔
𝑇𝑇 0.975,21 =2.08
𝑋𝑋𝑋𝑋:Salario semanal de Hombres y mujeres
Mujeres
𝑛𝑛2 = 15
�
𝑋𝑋2 = 360
𝑆𝑆2 = 90
Hombres
𝑛𝑛1 = 18
�
𝑋𝑋1 = 420
𝑆𝑆1 = 50
IC 𝝁𝝁𝟏𝟏 − 𝝁𝝁𝟐𝟐 = 420 − 360 ± 2.08 �
502
18
+
902
15
5.804 ≤ 𝝁𝝁𝟏𝟏 − 𝝁𝝁𝟐𝟐 ≤ 114.2
La diferencia entre los salarios medios semanales de hombres y mujeres se
encuentra comprendido entre S/. 5.804 y S/. 114.2 con el 95% de confianza.
IC 𝝁𝝁𝟏𝟏 − 𝝁𝝁𝟐𝟐 = ( �
𝑋𝑋1− �
𝑋𝑋2) − 𝑇𝑇 1−
𝛼𝛼
2
,𝑔𝑔𝑔𝑔
𝑠𝑠1
2
𝑛𝑛1
+
𝑆𝑆2
2
𝑛𝑛2
gl =
502
18
+
902
15
2
502
18
2
18 − 1
+
902
15
2
15 − 1
gl = 20.98 = 21
Estadística Inferencial
Solución a:
31. IC 𝝅𝝅 = 𝑝𝑝 ± 𝑍𝑍 1−
𝛼𝛼
2
⋅
𝑃𝑃(1 − 𝑃𝑃)
𝑛𝑛
Estadística Inferencial
Estimación Por intervalo
Intervalo de confianza para proporción (𝝅𝝅)
Población finita
𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷 𝑃𝑃 : 𝐸𝐸𝐸𝐸 =
𝑃𝑃(1 − 𝑃𝑃)
𝑛𝑛
�
𝑁𝑁 − 𝑛𝑛
𝑁𝑁 − 1
32. Estadística Inferencial
En una muestra aleatoria de 600 compradores de un centro
comercial, se encontró que 360 están a favor de que se construya un
ascensor adicional.
Calcule e interprete un intervalo del 95% de confianza para la
proporción verdadera de compradores que quieren se construya un
ascensor adicional
Estimación Por intervalo para una proporción (𝜋𝜋): Ejercicio
33. 𝐼𝐼𝐼𝐼 𝝅𝝅 = 𝒑𝒑 ± 𝑍𝑍(1−
𝛼𝛼
2
)
.
𝑝𝑝(1 − 𝑝𝑝)
𝑛𝑛
𝑛𝑛 = 600
𝑝𝑝 =
𝑥𝑥
𝑛𝑛
=
360
600
= 0.6
Datos población
𝑁𝑁𝑁𝑁 ℎ𝑎𝑎𝑎𝑎 𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑
Datos Muestra
𝑍𝑍
1−
0.05
2
𝑍𝑍 0.975 =1.96
𝑋𝑋: 𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶 𝑎𝑎 𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓 𝑑𝑑𝑑𝑑 𝑙𝑙𝑙𝑙 𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐: 𝑋𝑋=360
p = proporción muestral de compradores que están a favor..
𝐼𝐼𝐼𝐼 𝜋𝜋 = 𝟎𝟎, 𝟔𝟔 ± 1,96.
0,6(0,4)
600
0,561 ≤ 𝜋𝜋 ≤ 0,639
con un 95% de confianza la verdadera proporción (porcentaje) de compradores que quieren que se
construya un segundo ascensor en el centro comercial, se encuentra entre 0.561 y 0.639 (56.1% y 63.9%).
Estadística Inferencial
𝑁𝑁𝑁𝑁 = 1 − 𝛼𝛼 = 0.95
𝛼𝛼 = 0.05
Solución :
34. Estadística Inferencial
De un área de la ciudad en la que habitan 500 familias se
extrae una muestra aleatoria de 50 familias, obteniéndose
los siguientes datos sobre el número de hijos por familia:
Hijos por
familia
0 1 2 3 4 5
familias 20 10 7 6 4 3
Calcule e interprete intervalos de confianza del 90 % para
estimar La proporción de familias con menos de 2 hijos en
el área.
Estimación Por intervalo para una proporción (𝜋𝜋): Ejercicio
35. 𝐼𝐼𝐼𝐼 𝜋𝜋 = 𝑝𝑝 ± 𝑍𝑍(1−
𝛼𝛼
2
)
.
𝑝𝑝(1 − 𝑝𝑝)
𝑛𝑛
𝑁𝑁 − 𝑛𝑛
𝑁𝑁 − 1
𝑛𝑛 = 50
𝑝𝑝 =
𝑥𝑥
𝑛𝑛
=
30
50
= 0.6
Datos población
𝑁𝑁 = 500
𝑁𝑁𝑁𝑁 = 1 − 𝛼𝛼 = 0.90
𝛼𝛼 = 0.1
Datos Muestra
𝑍𝑍
1−
0.1
2
𝑍𝑍 0.95 =1.645
𝑋𝑋:familias con menos de 2 hijos , 𝑋𝑋=30
p = proporción muestral familias con menos 2 hijos
𝐼𝐼𝐼𝐼 𝜋𝜋 = 0,6 ± 1,645.
0,6(0,4)
600
500 − 50
499
0,551 ≤ 𝜋𝜋 ≤ 0,65
con un 90% de confianza la verdadera proporción (porcentaje) de familias con menos de 2 hijos se
encuentra entre 55,1% y 65%
Estadística Inferencial
Solución :
36. IC 𝜋𝜋1 − 𝜋𝜋2 = 𝑃𝑃1 − 𝑃𝑃2 ± 𝑍𝑍 1−
𝛼𝛼
2
⋅
)
𝑃𝑃1(1 − 𝑝𝑝1
𝑛𝑛1
+
)
𝑃𝑃2(1 − 𝑝𝑝2
𝑛𝑛2
Estadística Inferencial
Estimación Por intervalo
Intervalo de confianza para la diferencia de proporción (𝜋𝜋1 − 𝜋𝜋2)
37. Estadística Inferencial
Una empresa de estudios de mercado quiere estimar las
proporciones de hombres y mujeres que conocen un
producto promocionado a escala nacional. en una muestra
aleatoria de 100 hombres y 200 mujeres se determina que
20 hombres y 60 mujeres están familiarizados con el artículo
indicado.
a) Calcular el intervalo de confianza de 95 % para la
diferencia de proporciones de hombres y mujeres que
conocen el producto.
b) Son iguales las proporciones de hombres y mujeres que
conocen el producto?.
Estimación Por intervalo para diferencia proporciones
(𝜋𝜋1 − 𝜋𝜋2): Ejercicio
38. Datos población
𝑁𝑁𝑁𝑁 ℎ𝑎𝑎𝑎𝑎 𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑
𝑁𝑁𝑁𝑁 = 1 − 𝛼𝛼 = 0.95
𝛼𝛼 = 0.05
Datos Muestra
𝑍𝑍
1−
0.05
2
𝑍𝑍 0.975 =1.96
𝑋𝑋𝑋𝑋: h𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜 𝑜𝑜 𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚 𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓 𝑐𝑐𝑐𝑐𝑐𝑐 𝑒𝑒𝑒𝑒 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝
p = proporción de h𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜 𝑜𝑜 𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚 𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓
𝑐𝑐𝑐𝑐𝑐𝑐 𝑒𝑒𝑒𝑒 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝
−0,2009 ≤ 𝜋𝜋1 − 𝜋𝜋2 ≤ 0,0009
Con el 95% de confianza, la diferencia de proporciones verdadera de hombres y de mujeres que conocen
el producto, está entre -0.2009 y 0.0009.
Hombres
𝑛𝑛1 = 100
𝑝𝑝1 =
20
100
𝑝𝑝1 = 0,2
Mujeres
𝑛𝑛2 = 200
𝑝𝑝2 =
60
200
𝑝𝑝2 = 0,3
𝐼𝐼𝐼𝐼 𝜋𝜋1 − 𝜋𝜋2 = 𝑃𝑃1 − 𝑃𝑃2 ± 𝑍𝑍(1−
𝛼𝛼
2
)
.
𝑃𝑃1(1 − 𝑃𝑃1)
𝑛𝑛1
+
𝑃𝑃2(1 − 𝑃𝑃2)
𝑛𝑛2
𝐼𝐼𝐼𝐼 𝜋𝜋1 − 𝜋𝜋2 = 0,2 − 0,3 ± 1,96.
0,2 (0,8)
100
+
0,3 (0,7)
200
Solución a :
Estadística inferencial
Solución b : Son iguales las proporciones de hombres y mujeres que conocen el producto?. Rpta: SI
39. Estadística inferencial
Se entrevistaron dos grupos de mujeres de una tienda muy
famosa respecto a su nivel de satisfacción por la nuevas
prendas de vestir importadas de China. El 20% de las mujeres
menores a 50 años , de una muestra aleatoria de 300,
estuvieron satisfechas, mientras que el 27% de las mujeres
mayores a 50 años, de una muestra de 200, estuvieron
satisfechas.
Calcule e interprete un intervalo del 99 % de confianza para la
diferencia entre las verdaderas proporciones de mujeres
menores de 50 años y las de 50 años a más que estuvieron
satisfechas por las prendas chinas.
Estimación Por intervalo para diferencia proporciones
(𝜋𝜋1 − 𝜋𝜋2): Ejercicio
40. Mujeres <50
𝑛𝑛1 = 300
𝑝𝑝1 = 0,2
Mujeres >50
𝑛𝑛2 = 200
𝑝𝑝2 = 0,27
Datos población
𝑁𝑁𝑁𝑁 ℎ𝑎𝑎𝑎𝑎 𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑
𝑁𝑁𝑁𝑁 = 1 − 𝛼𝛼 = 0.99
𝛼𝛼 = 0.01
Datos Muestra
𝑍𝑍
1−
0.01
2
𝑍𝑍 0.995 =2.58
P= proporción de clientes satisfechas
Interpretación: la diferencia de proporciones de mujeres menores de 50 años y las de 50 años a más que mostraron
satisfacción por las prendas chinas, está entre -0.17 y 0.03 con el 99% de confianza.
𝐼𝐼𝐼𝐼 𝜋𝜋1 − 𝜋𝜋2 = 𝑃𝑃1 − 𝑃𝑃2 ± 𝑍𝑍(1−
𝛼𝛼
2
)
.
𝑃𝑃1(1 − 𝑃𝑃1)
𝑛𝑛1
+
𝑃𝑃2(1 − 𝑃𝑃2)
𝑛𝑛2
𝐼𝐼𝐼𝐼 𝜋𝜋1 − 𝜋𝜋2 = 0,2 − 0,27 ± 2,58.
0,2 (0,8)
300
+
0,27 (0,73)
200
−0,17 ≤ 𝜋𝜋1 − 𝜋𝜋2 ≤ 0,03
Estadística Inferencial
Solución :
41. IC 𝜎𝜎2
=
(𝑛𝑛 − 1)𝑆𝑆2
𝑋𝑋2
1−
𝛼𝛼
2,𝑛𝑛−1
≤ 𝜎𝜎2
≤
(𝑛𝑛 − 1)𝑆𝑆2
𝑋𝑋2 𝛼𝛼
2,𝑛𝑛−1
Estadística Inferencial
Estimación Por intervalo
Intervalo de confianza para la varianza (𝝈𝝈𝟐𝟐)
Distribución Ji- Cuadrada
42. En una muestra aleatoria de 25 estudiantes el promedio de tiempo de estudio para el examen final de un
determinado curso es 5.2 horas y una desviación estándar de 3.1 horas. Calcule e interprete un intervalo del 95%
para la desviación estándar del tiempo en horas de estudio para el examen final de dicho curso
Estudiantes
𝑛𝑛 = 25
�
𝑋𝑋 = 5.2
𝑆𝑆 = 3.1
Datos población
𝑁𝑁𝑁𝑁 ℎ𝑎𝑎𝑎𝑎 𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑
𝑁𝑁𝑁𝑁 = 1 − 𝛼𝛼 = 0.95
𝛼𝛼 = 0.05
Datos Muestra
𝑋𝑋; 𝐻𝐻𝐻𝐻𝐻𝐻𝐻𝐻𝐻𝐻 𝑑𝑑𝑑𝑑 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 𝑒𝑒𝑒𝑒 ℎ𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜
con una confianza del 95% la desviación estándar del tiempo de estudio esta comprendido de 2.42 a 4.31 horas
IC 𝜎𝜎2
=
(𝑛𝑛 − 1)𝑆𝑆2
𝑋𝑋2
1−
𝛼𝛼
2
,𝑛𝑛−1
≤ 𝜎𝜎2
≤
(𝑛𝑛 − 1)𝑆𝑆2
𝑋𝑋2 𝛼𝛼
2
,𝑛𝑛−1
𝑋𝑋2
1−
𝛼𝛼
2,𝑛𝑛−1
= 𝑋𝑋2
0.975,24 =39.4
𝑋𝑋2
𝛼𝛼
2
,𝑛𝑛−1
=𝑋𝑋2
0.025,24 = 12.4
IC 𝜎𝜎2 =
(25 − 1)3.12
39.4
≤ 𝜎𝜎2≤
(25 − 1)3.12
12.4
IC 𝜎𝜎2
= 5.85 ≤ 𝜎𝜎2
≤ 18.6
IC 𝜎𝜎 = 2.42 ≤ 𝜎𝜎 ≤ 4.31
Solución :
Estadística Inferencial
Estimación por intervalo para varianza 𝜎𝜎2: Ejercicio
45. Tamaño de muestra
Estadística Inferencial
𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇 𝑑𝑑𝑑𝑑 𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀: 𝑛𝑛 =
𝑍𝑍2
� 𝑃𝑃(1 − 𝑃𝑃)
𝐸𝐸2
𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷: 𝐸𝐸 = 𝑝𝑝 − 𝜋𝜋
Para la Proporción
Población Infinita
Población finita
𝑛𝑛 =
𝑁𝑁𝑍𝑍2
𝑃𝑃(1 − 𝑃𝑃)
𝐸𝐸2 𝑁𝑁 − 1 + 𝑍𝑍2𝑃𝑃(1 − 𝑃𝑃)
Donde:
n = el tamaño de la muestra, N = tamaño de la población.
𝑝𝑝 = Proporción poblacional o muestral. (P=0.5 ni no es conocido)
Z : NC=90% Z=1,645, NC=95% Z=1,96 , NC=99% Z=2.58
𝐸𝐸 = Límite aceptable de error muestral
Varia del 1% (0,01) y 9% (0,09), valor que queda a criterio del encuestador.
46. El área de calidad de una embotelladora, quiere determinar
la proporción de reclamos sobre el sabor de sus bebidas,
para ello desea determinar la muestra de clientes
necesarios con una confianza del 99% si desea cometer un
error máximo del 5%. Por estudios pilotos se sabe que 4 de
cada 10 clientes presentan reclamos por el sabor.
N=Infinito
𝑍𝑍 = 2.58
𝑝𝑝 = 0.4
𝐸𝐸 = 0.05 n =
2.582
� 0.4(0.6)
0.052
= 369 clientes
𝑛𝑛 =
𝑍𝑍2 � 𝑃𝑃(1 − 𝑃𝑃)
𝐸𝐸2
Dato:
Tamaño de muestra
Estadística Inferencial
Para la Proporción
Ejercicio
Solución
47. En un hotel, saben que el nivel de satisfacción de sus clientes
ronda el 90% y quieren realizar un estudio para ver si la
nueva gestión de limpiezas ha sido de su agrado. ¿Cuál sería
el tamaño necesario para la muestra, si el total de clientes
del hotel es de 10 000? Suponga un nivel de confianza para
los resultados del estudio del 95% y un error máximo
permitido del 5%.
N=10 000
𝑍𝑍 = 1,96
𝑝𝑝 = 0.9, q=0.1
𝐸𝐸 = 0.05
Dato:
Tamaño de muestra
Estadística Inferencial
Para la Proporción
𝑛𝑛 =
𝑁𝑁𝑍𝑍2
𝑃𝑃(1 − 𝑃𝑃)
𝐸𝐸2 𝑁𝑁 − 1 + 𝑍𝑍2𝑃𝑃(1 − 𝑃𝑃)
𝑛𝑛 =
10000 1.962
(0.9)(0.1)
0.052(10000 − 1) +1.962 (0.9)(0.1)
𝑛𝑛 = 136.42, 𝑛𝑛 = 137 𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐
Ejercicio
Solución
48. Tamaño de muestra
Estadística Inferencial
𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇 𝑑𝑑𝑑𝑑 𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀: 𝑛𝑛 =
𝑍𝑍2 � 𝜎𝜎2
𝐸𝐸2
𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷: 𝐸𝐸 = �
𝑋𝑋 − 𝜇𝜇
Para la media
Población Infinita
Población finita
𝑛𝑛 =
𝑁𝑁𝜎𝜎2𝑍𝑍2
𝑁𝑁 − 1 𝐸𝐸2 + 𝜎𝜎2𝑍𝑍2
Donde:
n = el tamaño de la muestra, N = tamaño de la población.
𝜎𝜎 = Desviación estándar de la población o S muestra piloto.
Z : NC=90% Z=1,645, NC=95% Z=1,96 , NC=99% Z=2.58
𝐸𝐸 = Límite aceptable de error muestral
49. Se hace un estudio de mercado, Para estimar la venta
promedio mensual de una nueva marca de gaseosas en las
tiendas, ¿Qué tamaño de muestra debe tomarse, si se desea
que ̅
𝑥𝑥 difiera de µ en menos de S/. 30, con el 95 % de
confianza?.
En una encuesta piloto previo a un conjunto de tiendas se
obtuvo una desviación estándar de 120 soles.
N = infinito
𝑍𝑍 = 1.96
𝑆𝑆 = 120
𝐸𝐸 = 30
n =
1.962
� 1202
302 = 61 tiendas
𝑛𝑛 =
𝑍𝑍2
� 𝜎𝜎2
𝐸𝐸2
Dato:
Tamaño de muestra
Estadística Inferencial
Para la media
Ejercicio
Solución
50. Calcular el tamaño de la muestra de una población de 500 piezas
de microchips, con la finalidad de conocer la longitud media de
estas, a razón de que el gerente de calidad sospecha que esta
longitud no cumple con las especificaciones. Use un nivel de
confianza del 95% y un error 0.05 cm y una desviación estándar
de 0.5
𝑁𝑁 = 500
𝑍𝑍 = 1.96
𝜎𝜎2
= 0.5
𝐸𝐸 = 0.05
Dato:
Tamaño de muestra
Estadística Inferencial
Para la media
𝑛𝑛 =
𝑁𝑁𝜎𝜎2
𝑍𝑍2
𝐸𝐸2 𝑁𝑁 − 1 + 𝜎𝜎2𝑍𝑍2
𝑛𝑛 =
500 � 0,52
� 1,962
0,052 500 − 1 + 0,52 � 1,962
𝑛𝑛 =
500 � 0,52
� 1,962
0,052 500 − 1 + 0,52 � 1,962
= 217.49 = 218 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝
Ejercicio
Solución
51. Población (N)
Estadísticos
Parámetros
Muestra (n)
Estadística Inferencial
Muestreo
El muestreo es el proceso de seleccionar un conjunto de
individuos de una población con el fin de estudiarlos y
poder caracterizar el total de la población
Tipos de muestreo
52. Tipos de muestreo
• De Conveniencia.
• Por Cuotas.
• Por Bola de nieve
• Aleatorio simple.
• Aleatorio sistemático.
• Aleatorio estratificado.
• Por Conglomerados.
Muestreo Probabilístico Muestreo no Probabilístico
Se basan en el principio de la
equiprobabilidad, es decir
todos los individuos tienen la
misma probabilidad de ser
elegidos para formar parte
de una muestra.
Representatividad
GeneralizaciónEstadísti
ca Inferencial
Estadística Inferencial
La muestra no es
representativa
No permite realizar
inferencias para la
población bajo
investigación.
53. Tipos de muestreo
• Aleatorio simple.
Muestreo Probabilístico
Estadística Inferencial
Paso1: Definir Marco Muestral ( lista total de las unidades de
análisis N)
Paso2: Determinar el tamaño de la muestra(n)
Paso3: Generar números aleatorios a fin de elegir las unidades
de análisis
Población N = 54 viviendas
Muestra n = 18
Fracción muestral p = n / N = 18 / 54 = 1/3
Cada vivienda tiene probabilidad de selección 1/3
Se seleccionan 18 números aleatorios entre 1 y 54
Se seleccionan las viviendas correspondientes
Ejemplo:
54. Tipos de muestreo
Muestreo Probabilístico
Estadística Inferencial
• Aleatorio sistemático.
Paso1: Definir el marco muestral, listado poblacional de las
unidades de análisis
Paso2: Determinar el tamaño de la muestra(n)
Paso3: Definir el intervalo de salto; P=N/n
Paso4: Elegir un número aleatorio( de inicio) entre 1 y P
por ejemplo r
Seleccionar las unidades r, r+p, r+2p, r+3p
55. Tipos de muestreo
Muestreo Probabilístico
Estadística Inferencial
• Aleatorio sistemático.
Ejemplo:
Seleccionar muestra de n = 20 empresas de lista de N = 500
empresas
● Esto significa que 1 de cada 25 empresas de la población se
seleccionará ( intervalo de salto 500/20 =25)
● Utilizando # al azar seleccionamos un número entre 1 y 25.
● Suponga que el # seleccionado es 7.
● Entonces la 1ra empresa. Seleccionada es el # 7 lista.
● Las otras 19 empresas de la muestra se obtienen sumando al
7 el intervalo de selección 25.
● Es decir: 07, 32, 57 , ..........
57. Tipos de muestreo
Muestreo Probabilístico
Estadística Inferencial
• Por Conglomerados.
La población podría estar muy dispersa geográficamente o
aparecer en cúmulos naturales, como las escuelas, hospitales,
manzanas, familias.
El muestreo por conglomerados se utiliza en la práctica debido
a que es más barato y conveniente obtener muestras por
conglomerados que al azar entre la población.
Se entiende la población como jerarquía de unidades
• personas viven en viviendas
• viviendas constituyen manzanas
• muchas manzanas hacen una ciudad
58. Tipos de muestreo
Muestreo Probabilístico
Estadística Inferencial
• Por Conglomerados.
Número de niños por manzana
Las 3510 manzanas de una ciudad se localizan en 90
poblados (urbanizaciones, AAHH y conjuntos
habitacionales).
El número de manzanas en las diferentes urbanizaciones,
AA.HH., C.H. no es el mismo .
Se selecciona una muestra aleatoria simple de 15 poblados y
se determina el # de niños por manzana.
59. Tipos de Muestreo
Muestreo no Probabilístico
Estadística Inferencial
Por Cuotas.
Se asienta generalmente sobre la base de un buen
conocimiento de los estratos de la población y/o de los
individuos más "representativos" o "adecuados" para los fines
de la investigación.
En este tipo de muestreo se fijan unas "cuotas" que consisten
en un número de individuos que reúnen unas determinadas
condiciones, por ejemplo: 20 individuos de 25 a 40 años, de
sexo femenino y residentes en Gijón. Una vez determinada la
cuota se eligen los primeros que se encuentren que cumplan
esas características. Este método se utiliza mucho en las
encuestas de opinión.
60. Tipos de muestreo
Muestreo no Probabilístico
Estadística Inferencial
• Por Bola de nieve
Se localiza a algunos individuos, los cuales conducen a otros, y
estos a otros, y así hasta conseguir una muestra suficiente. Este
tipo se emplea muy frecuentemente cuando se hacen estudios
con poblaciones "marginales", delincuentes, sectas,
determinados tipos de enfermos, etc.
61. Tipos de muestreo
De Conveniencia.
Muestreo no Probabilístico
Estadística Inferencial
Una muestra por conveniencia podría consistir en dirigirme a 3
universidades cercanas, simplemente porque están en la
población en la que reside el encuestador, y encuestar a unos
cuantos individuos que acepten participar al salir de las aulas
por la mañana.
Suele traducir en una gran facilidad operativa y en bajos costes
de muestreo,
62. Muestreo Probabilístico Muestreo no Probabilístico
Tipos de muestreo
Estadística Inferencial
Ventajas:
Tiene fundamento estadístico
matemático.
Es más representativo,
porque es más exacto.
El error con el que se trabaja
es menor y es posible decidir
con que error trabajar.
Desventajas:
Es costoso.
Requiere el conocimiento
previo del universo.
Ventajas:
Es menos costoso.
De selección más simple.
No requiere conocimiento
previo del universo.
No requiere tener identifi-
cadas las unidades de
análisis.
Desventajas:
Se trabaja con un error
desconocido.
No se puede calcular el
error.
Es menos representativo.
63. Conclusiones
1. Estimaciones de intervalos de confianza
La estimación de un intervalo para la media se puede
encontrar a través de una distribución norma (n>30) y a través
de una distribución T(n<30)
La distribución normal se usa encontrar un intervalo de
confianza para la proporción
La distribución ji-cuadrado se usa encontrar un intervalo de
confianza para la varianza
2. Determinación del tamaño de la muestra y Muestreo
Los tipos de muestreo son los probabilísticos y los no
probabilísticos, y el calculo del tamaño de la muestra está en
función de una población finita o infinita.