Se ha denunciado esta presentación.
Se está descargando tu SlideShare. ×

PPT_ESTADISTICA GENERAL_SEM-10_2022-2 SOLUCIONARIO.pptx

Anuncio
Anuncio
Anuncio
Anuncio
Anuncio
Anuncio
Anuncio
Anuncio
Anuncio
Anuncio
Anuncio
Anuncio
Cargando en…3
×

Eche un vistazo a continuación

1 de 86 Anuncio
Anuncio

Más Contenido Relacionado

Más reciente (20)

Anuncio

PPT_ESTADISTICA GENERAL_SEM-10_2022-2 SOLUCIONARIO.pptx

  1. 1. INTERVALO DE CONFIANZA Y TAMAÑO DE MUESTRA SEMANA 10 SESIÓN 19-20
  2. 2. RESULTADO DE APRENDIZAJE DE LA SESIÓN Al finalizar la sesión, el estudiante calcula los intervalos de confianza y tamaño de la muestra usando la fórmula correcta.
  3. 3. REFLEXIÓN DESDE LA EXPERIENCIA El consumo regular de cereales preendulzados contribuye a la caída de los dientes, enfermedades del corazón y otros procesos degenerativos. En una muestra aleatoria de 20 porciones sencillas de un cereal el contenido promedio de azúcar fue de 11.3 gr con desviación estándar de 2.45 gr. Suponiendo que los contenidos de azúcar están distribuidos normalmente. Determine un intervalo de confianza del 95% para el contenido promedio de azúcar en porciones sencillas de dicho cereal. https://bit.ly/34jDNIz
  4. 4. 𝑃𝑂𝐵𝐿𝐴𝐶𝐼Ó𝑁 𝑀𝑈𝐸𝑆𝑇𝑅𝐴 𝑛 = 20 𝑥 = 11.3 𝑆 = 2.45 𝑆𝑒 𝑎𝑝𝑙𝑖𝑐𝑎 𝑇 𝑠𝑡𝑢𝑑𝑒𝑛𝑡 𝑝𝑜𝑟𝑞𝑢𝑒 𝑛 ≤ 30 𝑥 − 𝑇𝛼 2 ∗ 𝑆 𝑛 < 𝜇 < 𝑥 + 𝑇𝛼 2 ∗ 𝑆 𝑛 11.3 − 2.093 ∗ 2.45 20 < 𝜇 < 11.3 + 2.093 ∗ 2.45 20 𝑇( 𝛼 2 ;𝐺𝐿) = 𝑇 ( 0.05 2 ;𝑛−1) = 𝑇(0.025;19) = 2.093 10.15 < 𝜇 < 12.45 𝑃𝑜𝑑𝑒𝑚𝑜𝑠 𝑎𝑓𝑖𝑟𝑚𝑎𝑟 𝑎 𝑢𝑛 95% 𝑑𝑒 𝑐𝑜𝑛𝑓𝑖𝑎𝑛𝑧𝑎 𝑞𝑢𝑒 𝑒𝑙 𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜 𝑑𝑒 𝑎𝑧𝑢𝑐𝑎𝑟 𝑒𝑠𝑡á 𝑒𝑛𝑡𝑟𝑒 10.15 𝑦 12.45 𝑔𝑟.
  5. 5. REFLEXIÓN DESDE LA EXPERIENCIA Responde en el Padlet las siguientes preguntas • ¿Cómo resuelvo la siguiente situación? • ¿Qué es un intervalo intervalo? • ¿Cómo se construye un intervalo de confianza? • ¿Qué elementos necesito para construir un intervalo de confianza?
  6. 6. Inferencia estadística Procedimiento que permite estimar resultados poblacionales a partir del análisis de una muestra. https://bit.ly/3u03h6H
  7. 7. Estimación Puntual (parámetro puede ser un número) Intervalos (parámetro se encuentra entre 2 números)
  8. 8. Estimador • La 𝑥 • Es un estadístico usado para estimar un parámetro desconocido de una población. Ejemplo: ҧ es un estimador de la mediade la población µ. • El valor numérico que resulta de esta fórmula se conoce como estimación del parámetro . • Características del estimador: - Debe ser insesgado. Si la media de la distribución del estimador es igual al parámetro. - Debe ser consistente. Si se aproxima al valor del parámetro cuanto mayor es n (tamaño de la muestra). - Eficiente: Es más eficiente que otro si la varianza de la distribución muestral del estimador es menor a la del otro estimador.
  9. 9. INTERVALOS DE CONFIANZA PARA LA MEDIA DE UNA POBLACIÓN Coeficientes de confiabilidad: Estimación por intervalos 𝟏 − 𝜶 = 𝟎, 𝟗𝟓 o 𝟏 − 𝜶 = 𝟗𝟓% « nivel de confianza » Casos: 𝑥ҧ − 𝑧(𝛼Τ2) 𝜎 < µ < 𝑥ҧ + 𝑧(𝛼Τ2) 𝜎 𝑛 𝑛 1. CUANDO LA MUESTRA PROVIENE 𝟏 − 𝜶 = 𝟎. 𝟗𝟎 entonces 𝒁α = 𝟏. 𝟔𝟒𝟓 𝟐 𝟏 − 𝜶 = 0.95 entonces 𝒁α = 𝟏. 𝟗𝟔 𝟏 − 𝜶 = 0,98 entonces 𝟐 𝒁α = 𝟐. 𝟑𝟑 𝟏 − 𝜶 = 0.99 entonces 𝟐 𝒁α = 𝟐. 𝟓𝟖 𝟐 DE UNA POBLACIÓN NORMAL CON σ2 CONOCIDA 𝐼𝐶 µ = 𝑥ҧ ± 𝑧(𝛼 Τ2) 𝜎 𝑛
  10. 10. Una máquina de refrescos esta ajustada de manera que la cantidad de liquido despachada tiene una distribución aproximadamente normal con una desviación estándar igual a 0.15 dl. Encuentre un intervalo de confianza de 95% para la media de los refrescos que sirve la maquina, si una muestra aleatoria de 36 tiene un contenido promedio de 2.25 dl. Ejemplo: IC µ = x ത ± z(αΤ2) σ n IC µ = 2.25 ± 1,96(0,15/√36) IC µ = 2.25 ± 0.049 IC µ = <2.201 , 2.299> Podemos afirmar con un 95% de confiabilidad que la cantidad media de líquido despachada por la máquina de refrescos se encuentra entre 2.201 y 2.299 dl. Resolución: https://bit.ly/3tFtG9E
  11. 11. 𝑥 − 𝑍𝛼 2 ∗ 𝜎 𝑛 < 𝜇 < 𝑥 + 𝑍𝛼 2 ∗ 𝜎 𝑛 𝑃𝑂𝐵𝐿𝐴𝐶𝐼Ó𝑁 𝑀𝑈𝐸𝑆𝑇𝑅𝐴 𝑛 = 36 𝑥 = 2.25 𝜎 = 0.15 𝑆𝑒 𝑎𝑝𝑙𝑖𝑐𝑎 𝑍 𝑑𝑒𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛 𝑛𝑜𝑟𝑚𝑎𝑙 𝑝𝑜𝑟𝑞𝑢𝑒 𝑛 > 30 2.25 − 1.96 ∗ 0.15 36 < 𝜇 < 2.25 + 1.96 ∗ 0.15 36 2.201 < 𝜇 < 2.299 𝑃𝑜𝑑𝑒𝑚𝑜𝑠 𝑎𝑓𝑖𝑟𝑚𝑎𝑟 𝑐𝑜𝑛 𝑢𝑛 𝑛𝑖𝑣𝑒𝑙 𝑑𝑒 𝑐𝑜𝑛𝑓𝑖𝑎𝑛𝑧𝑎 𝑑𝑒𝑙 95%, 𝑞𝑢𝑒 𝑒𝑙 𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜 𝑑𝑒 𝑟𝑒𝑓𝑟𝑒𝑠𝑐𝑜 𝑞𝑢𝑒 𝑠𝑖𝑟𝑣𝑒 𝑢𝑛𝑎 𝑚´´𝑎𝑞𝑢𝑖𝑛𝑎 𝑒𝑠𝑡𝑎 𝑒𝑛𝑡𝑟𝑒 2.201 𝑦 2.299 𝑑𝑙
  12. 12. Ejemplo: Un director de producción sabe que la cantidad de impurezas contenida en los envases de cierta sustancia química sigue una distribución normal con una desviación estándar de 3.8 gr. Se extrae una muestra aleatoria de 9 envases cuyos contenidos de impurezas son los siguientes: Determinar un intervalo de confianza del 95% para la media poblacional Resolución: Podemos afirmar con un 95% de confiabilidad que la cantidad media de impurezas contenida en los envases es de 16.68 con un margen de error de 2.48 IC µ = x ത ± z(αΤ2) σ n IC µ = 16.68 ± 1,96(3,8/√9) IC µ = 16.68 ± 2.48 IC µ = <14.2 , 19.16> https://bit.ly/3HXWjUq
  13. 13. 𝑥 − 𝑍𝛼 2 ∗ 𝜎 𝑛 < 𝜇 < 𝑥 + 𝑍𝛼 2 ∗ 𝜎 𝑛 𝑃𝑂𝐵𝐿𝐴𝐶𝐼Ó𝑁 𝑀𝑈𝐸𝑆𝑇𝑅𝐴 𝑛 = 9 𝑥 = 16.68 𝜎 = 3.8 𝑆𝑒 𝑎𝑝𝑙𝑖𝑐𝑎 𝑍 𝑑𝑒 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛 𝑛𝑜𝑟𝑚𝑎𝑙 𝑝𝑜𝑟𝑞𝑢𝑒 𝑝𝑜𝑟𝑞𝑢𝑒 𝑠𝑒 𝑐𝑜𝑛𝑜𝑐𝑒 𝑙𝑎 𝑑𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛 𝑒𝑠𝑡𝑎𝑛𝑑𝑎𝑟 𝑑𝑒 𝑙𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛 16.68 − 1.96 ∗ 3.8 9 < 𝜇 < 16.68 + 1.96 ∗ 3.8 9 14.2 < 𝜇 < 19.16 𝑝𝑜𝑑𝑒𝑚𝑜𝑠 𝑎𝑓𝑖𝑟𝑚𝑎𝑟 𝑐𝑜𝑛 𝑢𝑛 𝑛𝑖𝑣𝑒𝑙 𝑑𝑒 𝑐𝑜𝑛𝑓𝑖𝑎𝑛𝑧𝑎 𝑑𝑒𝑙 95%, 𝑞𝑢𝑒 𝑒𝑙 𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜 𝑑𝑒 𝑖𝑚𝑝𝑢𝑟𝑒𝑧𝑎𝑠 𝑒𝑠𝑡á 𝑒𝑛𝑡𝑟𝑒 14.2 𝑦 19.16 𝑔𝑟
  14. 14. Ejemplo: Suponga estimación que un investigador interesado en obtener del nivel promedio de alguna enzima en una cierta población de seres humanos, toma un muestra de 10 individuos. Determina el nivel de la enzima en cada uno de ellos, si la media de la muestra 𝑥ҧ ҧ = 𝟐𝟐. Además, se sabe que la variable de i n t e r é s sigue una distribución aproximadamente normal, con una varianza de 45. Determinar un intervalo de confianza del 95% para la media. Resolución: El intervalo de confianza aproximadamente 95% para µ está dado por: Podemos afirmar con un 95% de confiabilidad que el nivel promedia de dicha enzima en la población estaría entre 17.8 y 26.2. IC µ = x ത ± z(αΤ2) σ n IC µ = 22 ± 1,96(6.7082/√10) IC µ = 22 ± 4.2 IC µ = <17.8 , 26.2> https://bit.ly/3KntdPY
  15. 15. 𝑥 − 𝑍𝛼 2 ∗ 𝜎 𝑛 < 𝜇 < 𝑥 + 𝑍𝛼 2 ∗ 𝜎 𝑛 𝑃𝑂𝐵𝐿𝐴𝐶𝐼Ó𝑁 𝑀𝑈𝐸𝑆𝑇𝑅𝐴 𝑛 = 10 𝑥 = 22 𝜎 = 45 = 6.7 22 − 1.96 ∗ 6.7 10 < 𝜇 < 22 + 1.96 ∗ 6.7 10 17.8 < 𝜇 < 26.2 𝑝𝑜𝑑𝑒𝑚𝑜𝑠 𝑎𝑓𝑖𝑟𝑚𝑎𝑟 𝑐𝑜𝑛 𝑢𝑛 𝑛𝑖𝑣𝑒𝑙 𝑑𝑒 𝑐𝑜𝑛𝑓𝑖𝑎𝑛𝑧𝑎 𝑑𝑒𝑙 95%, 𝑞𝑢𝑒 𝑒𝑙 𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜 𝑑𝑒 𝑝𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛 𝑑𝑒 𝑢𝑛𝑎 𝑒𝑛𝑧𝑖𝑚𝑎 𝑒𝑠𝑡á 𝑒𝑛𝑡𝑟𝑒 17.8 𝑦 26.2 𝑔𝑟
  16. 16. Propiedades: - Tiene una media igual a cero. - Es simétrica respecto a la media. - Tiene una varianza mayor que 1, tendiendo a 1 a medida que aumenta el tamaño de la muestra. Es necesario calcular los grados de libertad (df) = n-1 - La variable t va de - ∞ ℎ𝑎𝑠𝑡𝑎 + ∞ - Existe un valor diferente para cada valor de la - muestra n-1. - Comparada con distribución normal, la distribución t es menos espigada en el centro y tiene colas mas largas. - La distribución t se aproxima a la normal a medida que n- 1 se aproxima al infinito. Distribución t de student https://bit.ly/3tuFmvI
  17. 17. Intervalo de confianza para la media de una población Estimación por intervalos 𝟏 − 𝜶 = 𝟎, 𝟗𝟓 o 𝟏 − 𝜶 = 𝟗𝟓% « nivel de confianza » 2. CUANDO LA MUESTRA PROVIENE DE UNA POBLACIÓN NORMAL CON σ2 DESCONOCIDA (n≤30) 𝐼𝐶 µ = 𝑥ҧ ± 𝑡(𝛼Τ2,𝑛−1) 𝑠 𝑛 𝑥ҧ − 𝑡(𝛼Τ2,𝑛−1) 𝑠 < µ < 𝑥ҧ + 𝑡(𝛼Τ2,𝑛−1) 𝑠 𝑛 𝑛
  18. 18. En el departamento de personal de una compañía grande se requiere estimar los gastos familiares en odontología de sus empleados para determinar la factibilidad de proporcionarles un plan de seguro dental. Una muestra aleatoria de 10 empleados reveló los siguientes gastos (en dólares) durante el año anterior: Establezca un intervalo de confianza del 90% para el gasto promedio familiar en odontología. Además se sabe que la variable de interés sigue una distribución normal. 110 362 246 85 510 208 173 425 316 179 Ejemplo: https://bit.ly/3CrdjBs
  19. 19. 𝑃𝑂𝐵𝐿𝐴𝐶𝐼Ó𝑁 𝑀𝑈𝐸𝑆𝑇𝑅𝐴 𝑛 = 10 𝑥 = 261.4 𝑆 = 138.8 𝑆𝑒 𝑎𝑝𝑙𝑖𝑐𝑎 𝑇 𝑠𝑡𝑢𝑑𝑒𝑛𝑡 𝑝𝑜𝑟𝑞𝑢𝑒 𝑛 ≤ 30 𝑥 − 𝑇𝛼 2 ∗ 𝑆 𝑛 < 𝜇 < 𝑥 + 𝑇𝛼 2 ∗ 𝑆 𝑛 𝑇( 𝛼 2 ;𝐺𝐿) = 𝑇 ( 0.10 2 ;𝑛−1) = 𝑇(0.05;9) = 1.833 261.4 − 1.833 ∗ 138.8 10 < 𝜇 < 261.4 + 1.833 ∗ 138.8 10 180.9 < 𝜇 < 341.9 𝑃𝑜𝑑𝑒𝑚𝑜𝑠 𝑎𝑓𝑖𝑟𝑚𝑎𝑟 𝑐𝑜𝑛 𝑢𝑛 𝑛𝑖𝑣𝑒𝑙 𝑑𝑒 𝑐𝑜𝑛𝑓𝑖𝑎𝑛𝑧𝑎 𝑑𝑒𝑙 90%, 𝑞𝑢𝑒 𝑒 𝑙 𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜 𝑑𝑒 𝑔𝑎𝑠𝑡𝑜 𝑓𝑎𝑚𝑖𝑙𝑖𝑎𝑟 𝑒𝑛 𝑜𝑑𝑜𝑛𝑡𝑜𝑙𝑜𝑔í𝑎 𝑒𝑠𝑡á 𝑒𝑛𝑡𝑟𝑒 180.9 𝑦 341.9 𝑑ó𝑙𝑎𝑟𝑒𝑠.
  20. 20. Resolución: En este caso como la varianza σ2 Student: es desconocida utilizaremos la fórmula t de Aplico la fórmula: Datos: n = 10 𝑥ҧ = 261.4 s = 138.8 gl= 9 1-α=0.90 𝑡(𝛼Τ2;𝑛−1) = 1.833 138.8 IC µ = 261.4 ± 1.833( ) √10 IC µ = 261.4 ± 80.4548 IC µ = <180.9, 341.9> IC µ = 𝑥ҧ ± 𝑡 (𝛼Τ2;𝑛−1) 𝑠 𝑛 Se puede decir con 90% de confianza que el gasto promedio anual (μ)de los familiares de los empleados en odontología se encuentra entre 180.9 y 341.9 dólares aproximadamente.
  21. 21. Un fabricante de maquinas despachadoras de refrescos asegura que sus productos sirven en promedio 240 ml en 99% de los casos. Un comprador decide verificar una de las de 20 maquinas, para esto toma una muestra aleatoria refrescos, de la que obtiene las siguientes medidas: Si se supone normalidad en los datos y una confianza de 99%, determine si es válida la afirmación del fabricante. Ejemplo: 243 250 240 248 245 250 238 246 252 247 246 240 250 249 248 240 245 247 238 248 https://bit.ly/3tFtG9E
  22. 22. 𝑃𝑂𝐵𝐿𝐴𝐶𝐼Ó𝑁 𝑀𝑈𝐸𝑆𝑇𝑅𝐴 𝑛 = 20 𝑥 = 245.5 𝑆 = 4.286 𝑆𝑒 𝑎𝑝𝑙𝑖𝑐𝑎 𝑇 𝑠𝑡𝑢𝑑𝑒𝑛𝑡 𝑝𝑜𝑟𝑞𝑢𝑒 𝑛 ≤ 30 𝑥 − 𝑇𝛼 2 ∗ 𝑆 𝑛 < 𝜇 < 𝑥 + 𝑇𝛼 2 ∗ 𝑆 𝑛 𝑇( 𝛼 2;𝐺𝐿) = 𝑇 ( 0.01 2 ;𝑛−1) = 𝑇(0.005;19) = 2.861 245.5 − 2.861 ∗ 4.286 20 < 𝜇 < 245.5 + 2.861 ∗ 4.286 20 242.8 < 𝜇 < 248.2 𝐻1: 𝐸𝑙 𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜 𝑞𝑢𝑒 𝑟𝑒𝑐𝑖𝑏𝑒 𝑝𝑜𝑟 𝑙𝑎 𝑚á𝑞𝑢𝑖𝑛𝑎 𝑑𝑒 𝑟𝑒𝑓𝑟𝑒𝑠𝑐𝑜 𝑒𝑠 240 𝑚𝑙 (𝐹𝑎𝑏𝑟𝑖𝑐𝑎𝑛𝑡𝑒) 𝑃𝑜𝑑𝑒𝑚𝑜𝑠 𝑎𝑓𝑖𝑟𝑚𝑎𝑟 𝑎 𝑢𝑛 99% 𝑞𝑢𝑒 𝑒𝑙 𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜 𝑞𝑢𝑒 𝑜𝑓𝑟𝑒𝑐𝑒 𝑙𝑎 𝑚á𝑞𝑢𝑖𝑛𝑎 𝑒𝑠𝑡á 𝑒𝑛𝑡𝑟𝑒 242.8 𝑦 248.2 𝑚𝑙, 𝑝𝑜𝑟 𝑙𝑜 𝑡𝑎𝑛𝑡𝑜 𝑒𝑙 𝑓𝑎𝑏𝑟𝑖𝑐𝑎𝑛𝑡𝑒 𝑛𝑜 𝑒𝑠 𝑣á𝑙𝑖𝑑𝑎 𝑠𝑢 𝑎𝑓𝑖𝑟𝑚𝑎𝑐𝑖ó𝑛 𝑝𝑜𝑟𝑞𝑢𝑒 𝑒𝑠𝑡á 𝑓𝑢𝑒𝑟𝑎 𝑑𝑒𝑙 𝑟𝑎𝑛𝑔𝑜.
  23. 23. Resolución: En este caso como la varianza σ 2 es desconocida utilizaremos la fórmula t de Student: Aplico la fórmula: Datos: n = 20 𝑥ҧ = 245.5 s = 4.29 gl= 19 1-α=0.99 𝑡(𝛼Τ2;𝑛−1)=2.861 √20 IC µ = 245.5 ± 2.861(4.29 ) IC µ = 245.5 ± 2.74 IC µ = <242.8, 248.2> IC µ = 𝑥ҧ ± 𝑡 (𝛼Τ2;𝑛−1) 𝑠 𝑛 Se puede decir con 99% de confianza que la cantidad promedio (μ) despachado por la maquina se encuentra entre 242.8 y 248.2 ml. Por lo tanto la afirmación del fabricante no será válida con una confianza del 99%, ya que el valor de 240 ml quedó fuera del intervalo de confianza.
  24. 24. 𝒙 ഥ±𝒛𝛼Τ2 Error estándar estimado de la media muestral Ejemplo: Una compañía emplea 200 agentes de ventas; en una muestra aleatoria de 25, los auditores encontraron un gasto promedio de $220 con una desviación estándar de $20 en sus cuentas de gasto de representación en una semana. Establezca un intervalo de confianza del 98% para el gasto promedio semanal. 𝒙 ഥ±𝒕 (𝛼Τ2; 𝑛 − 1) 𝝈 𝑵−𝒏 𝑺 𝑵−𝒏 𝒏 𝑵−𝟏 𝒏 𝑵−𝟏 Cuando el muestreo es sin reemplazo en una población finita
  25. 25. INTERVALOS DE CONFIANZA PARA LA PROPORCIÓN DE UNA POBLACIÓN El intervalo de confianza se obtiene : 2 2 p(1  p) n P  p  Z p(1 p)  n p  Z   Estimador ± coeficiente de confiabilidad x error estándar IC P = 𝑝 ± 𝑍(𝛼Τ2) 𝑝(1 − 𝑝) 𝑛 𝑝 − 𝑍𝛼 2 ∗ 𝑝 1 − 𝑝 𝑛 < 𝜋 < 𝑝 + 𝑍𝛼 2 ∗ 𝑝(1 − 𝑝) 𝑛
  26. 26. En cierta ciudad, se entrevistó a una muestra de 500 bebedores de cerveza, hallándose que 114 de ellos preferían la marca X a la de Y . Hállese el intervalo de confianza del 98% para la fracción de bebedores de cerveza de esa ciudad que prefieren la marca X. Resolución: Ejemplo: p = 114/500 = 0.228 𝑧α 2 = 2.33 IC P = 0.228 ± 2.33* 0.228(1−0.228) 500 IC P = 0.228 ± 0.0437 IC P =< 0.1843 , 0.2717> Podemos afirmar con un 98% de confianza que el porcentaje (P) de bebedores que prefieren la marca de cerveza X es de 22.8% con un margen de error de 4.37% https://bit.ly/3vUFRSz IC P = 𝑝 ± 𝑍(𝛼Τ2) 𝑝(1 − 𝑝) 𝑛
  27. 27. 𝑝 − 𝑍𝛼 2 ∗ 𝑝 1 − 𝑝 𝑛 < 𝜋 < 𝑝 + 𝑍𝛼 2 ∗ 𝑝(1 − 𝑝) 𝑛 𝑃𝑂𝐵𝐿𝐴𝐶𝐼Ó𝑁 𝑀𝑈𝐸𝑆𝑇𝑅𝐴 𝑛 = 500 𝑝 = 114 500 𝑝𝑟𝑜𝑝𝑜𝑟𝑐𝑖ó𝑛 𝑞𝑢𝑒 𝑝𝑟𝑒𝑓𝑖𝑒𝑟𝑒 𝑚𝑎𝑟𝑐𝑎 𝑋 𝑞𝑢𝑒 𝑌 𝑝𝑟𝑜𝑝𝑜𝑟𝑐𝑖ó𝑛𝑛 𝑞𝑢𝑒 𝑛𝑜 𝑝𝑟𝑒𝑓𝑖𝑒𝑟𝑒 𝑚𝑎𝑟𝑐𝑎 𝑋 𝑞𝑢𝑒 𝑌 1 − 𝑝 = 386 500 114 500 − 2.33 ∗ 114 500 ∗ 386 500 500 < 𝜋 < 114 500 + 2.33 ∗ 114 500 ∗ 386 500 500 0.1843 < 𝜋 < 0.2717 𝑃𝑜𝑑𝑒𝑚𝑜𝑠 𝑎𝑓𝑖𝑟𝑚𝑎𝑟 𝑐𝑜𝑛 𝑢𝑛 𝑛𝑖𝑣𝑒𝑙 𝑑𝑒 𝑐𝑜𝑛𝑓𝑖𝑎𝑛𝑧𝑎 𝑑𝑒𝑙 98%, 𝑞𝑢𝑒 𝑒𝑙 𝑝𝑜𝑟𝑐𝑒𝑛𝑡𝑎𝑗𝑒 𝑑𝑒 𝑏𝑒𝑏𝑒𝑑𝑜𝑟𝑒𝑠 𝑞𝑢𝑒 𝑝𝑟𝑒𝑓𝑖𝑒𝑟𝑒 𝑙𝑎 𝑚𝑎𝑟𝑐𝑎 𝑋 𝑞𝑢𝑒 𝑑𝑒 𝑌 𝑒𝑠𝑡á 𝑒𝑛𝑡𝑟𝑒 18.43% 𝑦 27.17%
  28. 28. Ejemplo: En una muestra de 591 pacientes internados en un hospital psiquiátrico, se encontró que 204 admitieron haber consumido marihuana al menos una vez durante su vida. Se pretende construir un intervalo de confianza de 95%, para la proporción de individuos que consumieron marihuana durante su vida en la población muestreada de los internos del hospital psiquiátrico. Resolución: p = 204/591=0.35 n = 591 IC P = 𝟎. 𝟑𝟓 ±1.96 𝟎,𝟑𝟓(𝟏−𝟎.𝟑𝟓) 𝟓𝟗𝟏 IC P = 0.35 ± 𝟎. 𝟎𝟑𝟖 IC P =<0.307, 0.383> Se puede decir con un 95% de confianza que el porcentaje (P) de pacientes en dicho hospital psiquiátrico, que consumieron marihuana durante su vida se encuentra entre 30.7% y 38.3% . IC P = 𝑝 ± 𝑍(𝛼Τ2) 𝑝(1 − 𝑝) 𝑛
  29. 29. 1) Se pretende estimar un intervalo de confianza para el número promedio de latidos por minuto para cierta población. Se encontró que el número promedio de latidos por minuto para 49 personas era de 90. Considere que esos 49 pacientes constituyen una muestra aleatoria y que la población sigue una distribución normal, con una desviación estándar de 10. Use α= 0.02 APLIQUEMOS LO APRENDIDO
  30. 30. 𝑥 − 𝑍𝛼 2 ∗ 𝜎 𝑛 < 𝜇 < 𝑥 + 𝑍𝛼 2 ∗ 𝜎 𝑛 𝑃𝑂𝐵𝐿𝐴𝐶𝐼Ó𝑁 𝑀𝑈𝐸𝑆𝑇𝑅𝐴 𝑛 = 49 𝑥 = 90 𝜎 = 10 90 − 2.33 ∗ 10 49 < 𝜇 < 90 + 2.33 ∗ 10 49 86.67 < 𝜇 < 93.33 𝑆𝑒 𝑝𝑢𝑒𝑑𝑒 𝑎𝑓𝑖𝑟𝑚𝑎𝑟 𝑐𝑜𝑛 𝑢𝑛 𝑛𝑖𝑣𝑒𝑙 𝑑𝑒 𝑐𝑜𝑛𝑓𝑖𝑎𝑛𝑧𝑎 𝑑𝑒𝑙 98%, 𝑞𝑢𝑒 𝑒𝑙 𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜 𝑑𝑒 𝑙𝑎𝑡𝑖𝑑𝑜𝑠 𝑝𝑜𝑟 𝑚𝑖𝑛𝑢𝑡𝑜 𝑒𝑛 𝑢𝑛𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛 𝑒𝑠𝑡á 𝑒𝑛𝑡𝑟𝑒 86.67 𝑦 93.33
  31. 31. 2) En una muestra al azar de 127 niños de guarderías infantiles se han diagnosticado 7 niños con sintomatología autista y 12 niños con enuresis nocturna. Utilizando α= 0.05. a) Determine un intervalo de confianza para la proporción de niños autistas que hay en la población, origen de la muestra. b)Determine un intervalo de confianza para la proporción de niños con enuresis nocturna que hay en la población, origen de la muestra.
  32. 32. 𝑝 − 𝑍𝛼 2 ∗ 𝑝 1 − 𝑝 𝑛 < 𝜋 < 𝑝 + 𝑍𝛼 2 ∗ 𝑝(1 − 𝑝) 𝑛 𝑃𝑂𝐵𝐿𝐴𝐶𝐼Ó𝑁 𝑀𝑈𝐸𝑆𝑇𝑅𝐴 𝑛 = 127 𝑝 = 7 127 𝑝𝑟𝑜𝑝𝑜𝑟𝑐𝑖ó𝑛 𝑑𝑒 𝑛𝑖ñ𝑜𝑠 𝑞𝑢𝑒 𝑠𝑢𝑓𝑟𝑒 𝑎𝑢𝑡𝑖𝑠𝑚𝑜 𝑝𝑟𝑜𝑝𝑜𝑟𝑐𝑖ó𝑛 𝑑𝑒 𝑛𝑖ñ𝑜𝑠 𝑞𝑢𝑒 𝑛𝑜 𝑠𝑢𝑓𝑟𝑒 𝑎𝑢𝑡𝑖𝑠𝑚𝑜 1 − 𝑝 = 120 127 7 127 − 1.96 ∗ 7 127 ∗ 120 127 127 < 𝜋 < 7 127 + 1.96 ∗ 7 127 ∗ 120 127 127 0.015 < 𝜋 < 0.095 𝑃𝑜𝑑𝑒𝑚𝑜𝑠 𝑎𝑓𝑖𝑟𝑚𝑎𝑟 𝑎 𝑢𝑛 95% 𝑞𝑢𝑒 𝑙𝑎 𝑝𝑟𝑜𝑝𝑜𝑟𝑐𝑖ó𝑛 𝑑𝑒 𝑛𝑖ñ𝑜𝑠 𝑞𝑢𝑒 𝑠𝑢𝑓𝑟𝑒𝑛 𝑎𝑢𝑡𝑖𝑠𝑚𝑜 𝑒𝑛 𝑢𝑛 𝑝𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛 𝑒𝑠𝑡á 𝑒𝑛𝑡𝑟𝑒 1.5% 𝑦 9.5% 𝑞 = 12 127 𝑝𝑟𝑜𝑝𝑜𝑟𝑐𝑖ó𝑛 𝑑𝑒 𝑛𝑖ñ𝑜𝑠 𝑞𝑢𝑒 𝑠𝑢𝑓𝑟𝑒 𝑒𝑛𝑢𝑟𝑒𝑠𝑖𝑠 𝑛𝑜𝑐𝑡𝑢𝑟𝑛𝑎 𝑝𝑟𝑜𝑝𝑜𝑟𝑐𝑖ó𝑛 𝑑𝑒 𝑛𝑖ñ𝑜𝑠 𝑞𝑢𝑒 𝑛𝑜 𝑠𝑢𝑓𝑟𝑒 𝑒𝑛𝑢𝑟𝑒𝑠𝑖𝑠 𝑛𝑜𝑐𝑡𝑢𝑟𝑛𝑎 1 − 𝑞 = 115 127 12 127 − 1.96 ∗ 12 127 ∗ 115 127 127 < 𝜋 < 12 127 − 1.96 ∗ 12 127 ∗ 115 127 127 0.04 < 𝜋 < 0.14 𝑃𝑜𝑑𝑒𝑚𝑜𝑠 𝑎𝑓𝑖𝑟𝑚𝑎𝑟 𝑎 𝑢𝑛 95% 𝑞𝑢𝑒 𝑙𝑎 𝑝𝑟𝑜𝑝𝑜𝑟𝑐𝑖ó𝑛 𝑑𝑒 𝑛𝑖ñ𝑜𝑠 𝑞𝑢𝑒 𝑠𝑢𝑓𝑟𝑒𝑛 𝑒𝑛𝑢𝑟𝑒𝑠𝑖𝑠 𝑛𝑜𝑐𝑡𝑢𝑟𝑛𝑎 𝑒𝑛 𝑢𝑛 𝑝𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛 𝑒𝑠𝑡á 𝑒𝑛𝑡𝑟𝑒 4% 𝑦 14%
  33. 33. 3) Se quiere estudiar los niveles de nitrógeno ureico en la orina el cual se distribuye normalmente, pero se desconoce el valor de los parámetros poblacionales que esta variable aleatoria tiene en un grupo de pacientes con una determina patología. Con el fin de determinar los mismos se escoge una muestra representativa de dicha población, obteniéndose los siguientes valores: Determine el intervalo de confianza al 95% y 99% e interprete. 11.2 12.5 16.6 14.2 17.5 19.4 15.5 14.6 17.6 17.3 13.2 14.2 15.9 16.1 18.2
  34. 34. 𝑥 = 15.6 𝑆 = 2.28 𝑀𝑈𝐸𝑆𝑇𝑅𝐴 𝑃𝑂𝐵𝐿𝐴𝐶𝐼Ó𝑁 𝑥 − 𝑇𝛼 2 ∗ 𝑆 𝑛 < 𝜇 < 𝑥 + 𝑇𝛼 2 ∗ 𝑆 𝑛 𝑇( 𝛼 2 ;𝐺𝐿) = 𝑇 ( 0.05 2 ;14) = 2.145 𝑛 = 15 El intervalo de confianza al 95% 15.6 − 2.145 ∗ 2.28 15 < 𝜇 < 15.6 + 2.145 ∗ 2.28 15 14.33 < 𝜇 < 16.86 El intervalo de confianza al 99% 𝑇( 𝛼 2 ;𝐺𝐿) = 𝑇 ( 0.01 2 ;14) = 2.977 15.6 − 2.977 ∗ 2.28 15 < 𝜇 < 15.6 + 2.977 ∗ 2.28 15 13.84 < 𝜇 < 17.35
  35. 35. 4) En una investigación acerca de la dependencia del flujo y volumen de todo sistema respiratorio en un grupo de pacientes con enfermedad obstructiva pulmonar crónica, conectados a respiradores artificiales, registraron los siguientes valores de línea de base de flujo continuo inspiratorio(l/s): 0.90, 0.97, 1.03, 1.10, 1.04, 1.00. Considere que una muestra aleatoria simple está conformada por seis individuos a partir de una población que sigue una distribución normal, con individuos con la misma enfermedad. Construya un intervalo de confianza del 95% para el flujo medio continuo inspiratorio de la población.
  36. 36. 𝑥 = 1.007 𝑆 = 0.068 𝑀𝑈𝐸𝑆𝑇𝑅𝐴 𝑃𝑂𝐵𝐿𝐴𝐶𝐼Ó𝑁 𝑥 − 𝑇𝛼 2 ∗ 𝑆 𝑛 < 𝜇 < 𝑥 + 𝑇𝛼 2 ∗ 𝑆 𝑛 𝑇( 𝛼 2 ;𝐺𝐿) = 𝑇 ( 0.05 2 ;5) = 2.571 𝑛 = 6 intervalo de confianza del 95% 1.007 − 2.571 ∗ 0.068 6 < 𝜇 < 1.007 + 2.571 ∗ 0.068 6 0.93 < 𝜇 < 1.07 𝑃𝑜𝑑𝑒𝑚𝑜𝑠 𝑎𝑓𝑖𝑟𝑚𝑎𝑟, 𝑎 𝑢𝑛 𝑛𝑖𝑣𝑒𝑙 𝑑𝑒 𝑐𝑜𝑛𝑓𝑖𝑎𝑛𝑧𝑎 𝑑𝑒𝑙 95%, 𝑞𝑢𝑒 𝑒𝑙 𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜 𝑑𝑒 𝑓𝑙𝑢𝑗𝑜 𝑖𝑛𝑠𝑝𝑖𝑟𝑎𝑡𝑜𝑟𝑖𝑎 𝑑𝑒 𝑢𝑛𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛 𝑒𝑠𝑡á 𝑒𝑛𝑡𝑟𝑒 0.93 𝑦 1.07 𝑙𝑖𝑡𝑟𝑜𝑠 𝑝𝑜𝑟 𝑠𝑒𝑔𝑢𝑛𝑑𝑜𝑠
  37. 37. INTEGRAMOS LO APRENDIDO • ¿Cómo puedes aplicar lo aprendido en la sesión a tu vida profesional? Metacognición • ¿Qué es lo que más te ha gustado de la sesión desarrollada? • ¿Qué es lo que aún puedes mejorar para determinar un intervalo de confianza? Recuperado de bl_articles_article_25120_82537ded723- 23a9-4be4-a8ad-c30ef9a98620.jpg (1200×628) (webteb.net)
  38. 38. REFLEXIÓN DESDE LA EXPERIENCIA Un investigador está interesado en conocer la opinión en una población conformada por 3176 padres de familia de una región, con respecto a la aceptación de los programas de planificación familiar y para ello desea aplicar una encuesta, por lo que necesita saber la cantidad de padres de familia que se deben entrevistar; para tener una información adecuada con un error de muestreo de 0.025, al 95% de confiabilidad. ¿Cómo debería proceder esta persona encargada de llevar a cabo dicho estudio? https://bit.ly/3Qoi1GG
  39. 39. Muestreo Conjunto de técnicas que se aplican para la extracción de una muestra. • Muestra: Es una colección de unidades de muestreo (unidades de análisis) obtenidas a partir de un marco muestral. • Marco muestral: Totalidad de las unidades de muestreo, entre las cuales se seleccionará la muestra.
  40. 40. Tipo de muestreo a. Muestreo probabilístico: Toda unidad de muestreo tiene una probabilidad conocida de pertenecer a la muestra y está sujeta a una aleatoriedad. Permite obtener indicadores de mayor confiabilidad, además medir y controlar el error de muestreo. Entre estos tipos de muestreo probabilístico tenemos: Muestreo aleatorio simple, muestreo sistemático, muestreo estratificado y muestreo por conglomerados.
  41. 41. Tipo de muestreo b. Muestreo no probabilístico: No están sujetas a una aleatoriedad. ejemplo: el muestreo por cuotas, utilizado en estudios de mercadeo y encuestas de opinión. Se fija un prototipo de personas para ser entrevistadas. Cuando los encuestadores cumplen la cuota de personas con ciertas características (sexo, ocupación, diferentes niveles de estudio, edad etc.) se completa la muestra.
  42. 42. Tipos de muestreo probabilístico
  43. 43. Tipos de muestreo probabilístico 1. Aleatorio simple: El muestreo aleatorio simple es el que más se utiliza en la estadística inferencial, la propiedad fundamental es que todos los individuos de la población tienen la misma probabilidad de ser elegidos. Este muestreo es menos eficaz cuando la población es heterogénea, en estos casos se recomienda utilizar otro tipo de muestreo.
  44. 44. Tipos de muestreo probabilístico 2. Sistemático En este caso se empieza dividiendo el número total de sujetos u observaciones que conforman la población, entre el tamaño de la muestra que se quiere utilizar; obteniendo un valor k. Posteriormente se escoge un número al azar de entre los k primeros datos; y a partir de allí se van eligiendo las unidades de análisis que formarán parte de la muestra cada cierto valor k.
  45. 45. Tipos de muestreo probabilístico 3. Estratificado: El muestreo aleatorio estratificado consiste en dividir la población en estratos; un ejemplo de esto sería estudiar la relación entre el ingreso mensual promedio y el nivel socioeconómico. A continuación, se extrae un número determinado de sujetos de cada uno de los estratos socioeconómicos con la finalidad de mantener la proporción de la población de referencia.
  46. 46. Tipos de muestreo probabilístico 4. De conglomerados En estadística inferencial los conglomerados son conjuntos de elementos poblacionales, como pueden ser los distritos, urbanizaciones o sectores de alguna localidad. Al llevar a cabo este tipo de muestreo se divide la población en conglomerados. Los conglomerados que formarán parte de muestra para ser estudiados se eligen de forma aleatoria.
  47. 47. Muestreo aleatorio simple Procedimiento mediante el cual se selecciona una muestra de tamaño n a partir de una población de tamaño N; tal que cada muestra posible de tamaño n tenga la misma probabilidad de ser seleccionada. Es recomendable cuando la población es relativamente homogénea. Procedimiento: Se enumeran las unidades de 1 a N, posteriormente se extrae una serie de n números aleatorios entre 1 y N, ya sea por sorteo, utilizando una tabla de números aleatorios o a través de un software estadístico.
  48. 48. Ejemplo 1 Supóngase que N = 1000 registros de pacientes, de los cuales se selecciona una muestra aleatoria n = 20. Consideremos una parte de los dígitos de cierta tabla de números aleatorios. Determinar qué registros se incluirán en la muestra de tamaño 20. Consideremos que los números asignados a cada uno de los registros son: 001, 002, 003,…………………..999, 1000 donde 001 representa el primer registro, 999 el registro del paciente 999 y 1000 el milésimo registro. Teniendo en cuenta la siguiente Tabla de Números Aleatorios:
  49. 49. Línea/ Col (1) (2) (3) (4) (5) (6) (7) (8) (9) 1 10480 15011 01536 02011 81647 91646 69179 14194 62590 2 22368 46573 25595 85393 30995 89198 27982 53402 93965 3 24130 48360 22527 97265 76393 64809 15179 24830 49340 4 42167 93093 06243 61680 07856 16376 39440 53537 71341 5 37570 39975 81837 16656 06121 91782 60468 81305 49684 6 77921 06907 11008 42751 27756 53498 18602 70659 90655 7 99562 72905 56420 69994 98872 31016 71194 18738 44013 8 96301 91977 05463 07972 18876 20922 94595 56869 69014 9 89579 14342 63661 10281 17453 18103 57740 84378 25331 10 85475 36857 53342 53998 53060 59533 38867 62300 08158 Tabla de números aleatorios Procedimiento Elegir cualquier número de la tabla como punto de partida, continuar hacia cualquier lado. En este caso partiremos de la primera columna, considerando los tres primeros dígitos; los registros elegidos serían: 104 223 241 421 y así sucesivamente hasta completar los 20 números
  50. 50. REFLEXIÓN DESDE LA EXPERIENCIA En algunas situaciones nos preguntamos ¿Cómo podemos determinar el tamaño óptimo de muestra para una investigación de mercado. ¿Bastará con aplicar un cuestionario a 100 personas o realmente es necesario encuestar a 450? ¿Cómo influye la variabilidad de las respuestas de cada encuestado? ¿Qué margen de error tendrán los resultados hallados en la encuesta?. Las respuestas a cada una de estas interrogantes lo veremos a continuación. https://bit.ly/3HVqhbV
  51. 51. REFLEXIÓN DESDE LA EXPERIENCIA Responde en el Padlet las siguientes preguntas • ¿Cómo resuelvo la siguiente situación? • ¿Cuál es el tamaño de la muestra? • ¿Qué es el margen de error?
  52. 52. Estimación del tamaño de muestra Depende de dos factores: • De la variabilidad de la población, a mayor variabilidad entre los elementos de la población, se requiere una muestra relativamente grande. • Del costo que implica analizar cada una de las unidades de muestreo.
  53. 53. Estimación del tamaño de muestra para la media Cuando N es desconocido Cuando N es conocido   e  Z   2 n    / 2  𝑍𝛼/2: 𝐶𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 𝑑𝑒 𝑐𝑜𝑛𝑓𝑖𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 𝜎: 𝐷𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛 𝑒𝑠𝑡á𝑛𝑑𝑎𝑟 𝑝𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛𝑎𝑙 𝑒: 𝑀 𝑎𝑟𝑔 𝑒 𝑛 𝑑𝑒 𝑒𝑟𝑟𝑜𝑟 𝑜 𝑒𝑟𝑟𝑜𝑟 𝑑𝑒 𝑒𝑠𝑡𝑖𝑚𝑎𝑐𝑖ó𝑛 Z 2 Z  ( N 1)e2 2 2  / 2 n   / 2  N 2 𝑛 = 𝑍𝛼/2 ∗ 𝜎 𝑒 2 𝑛 = 𝑍𝛼/2 2 ∗ 𝑁 ∗ 𝜎2 𝑍𝛼/2 2 ∗ 𝜎2 + (𝑁 − 1)𝑒2
  54. 54. Ejemplo 1 Se desea estimar el consumo promedio diario de agua en cierta comunidad. Por estudios anteriores se sabe σ2 = 1252. De qué tamaño tendrá que ser la muestra para que con un 95% de confiabilidad, ésta nos proporcione una media muestral; cuyo valor difiera del valor verdadero µ a lo más en 4 galones. https://bit.ly/3MCwEUM
  55. 55. 𝑃𝑂𝐵𝐿𝐴𝐶𝐼Ó𝑁 𝑀𝑈𝐸𝑆𝑇𝑅𝐴 𝜎2 = 1252 𝑒 = 4 𝑛 = 𝑍𝛼/2 ∗ 𝜎 𝑒 2 𝜎 = 35.38 𝑛 = 1.96 ∗ 35.38 4 2 = 301 𝑆𝑒 𝑛𝑒𝑐𝑒𝑠𝑖𝑡𝑎 301 𝑝𝑎𝑟𝑎 𝑙𝑜𝑔𝑟𝑎𝑟 𝑒𝑙 𝑜𝑏𝑗𝑒𝑡𝑖𝑣𝑜 Ahora suponiendo que N es conocido: N = 7000 𝑛 = 𝑍𝛼/2 2 ∗ 𝑁 ∗ 𝜎2 𝑍𝛼/2 2 ∗ 𝜎2 + (𝑁 − 1)𝑒2 𝑛 = 1.962 ∗ 7000 ∗ 1252 1.962 ∗ 1252 + (7000 − 1)42 = 289
  56. 56. RESOLUCIÓN 2 1.96x35.3836 2 4 e  Z  n   2      300.6  301       Se necesitará una muestra de 301 viviendas como mínimo para lograr dicho objetivo.
  57. 57. Z 2 Z  ( N 1)e2 2 2  / 2 n   / 2  N 2  288.3 aprox 289 (1.96)2 x7000(1252) n  1252(1.96)2  (6999)(4)2 Se necesitará una muestra de 289 viviendas como mínimo para lograr dicho objetivo. Ahora suponiendo que N es conocido: N = 7000
  58. 58. Ejemplo 2 Un médico desea conocer el valor medio de glucosa en la sangre en ayunas (mg/100ml) de pacientes atendidos en una clínica para diabéticos durante el transcurso de los últimos 10 años. Determine el número de registros que el médico debe examinar para un nivel de confianza del 90% para la media si el error debe ser de 0.5 unidades y la varianza es de 60.
  59. 59. 𝑃𝑂𝐵𝐿𝐴𝐶𝐼Ó𝑁 𝑀𝑈𝐸𝑆𝑇𝑅𝐴 𝑒 = 0.5 𝜎 = 60 𝑛 = 𝑍𝛼/2 2 ∗ 𝜎2 𝑒2 𝐿𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎 𝑠𝑒𝑟á 𝑑𝑒 645 𝑝𝑒𝑟𝑠𝑜𝑛𝑎𝑠 𝑛 = 1.6452 ∗ 60 0.52 = 645
  60. 60. Resolución Es decir la muestra tendrá que ser de 646 personas. 𝑛 = α/2 𝑍 σ 𝑒 2 = 1.64 ∗ 60 0.5 2 = 645.5
  61. 61. Estimación del tamaño de muestra para la proporción Cuando N es desconocido: 2 e 2 p̂ q̂ Z 2  n  Cuando N es conocido: Si p y q fueran desconocidos entonces p = q = 0.5 𝑛 = 𝑍𝛼/2 2 ∗ 𝜋 ∗ (1 − 𝜋) 𝑒2 𝑛 = 𝑍𝛼/2 2 ∗ 𝑁 ∗ 𝜋 ∗ (1 − 𝜋) 𝑍𝛼 2 2 ∗ 𝜋 ∗ (1 − 𝜋) ∗ 𝜎2 + (𝑁 − 1)𝑒2
  62. 62. Ejemplo 3 En una determinada región se desea estimar la proporción de individuos que padecen de afecciones pulmonares. ¿De qué tamaño tendrá que ser la muestra para obtener una proporción muestral; con margen de error del 4% y con un 95% de confiabilidad; si se sabe por estudios anteriores que dicha proporción era de 0,096? https://bit.ly/3pQFF2O
  63. 63. 𝑃𝑂𝐵𝐿𝐴𝐶𝐼Ó𝑁 𝑀𝑈𝐸𝑆𝑇𝑅𝐴 𝑒 = 4% 𝜋 = 0.096 1 − 𝜋 = 0.904 𝑛 = 𝑍𝛼/2 2 ∗ 𝜋 ∗ (1 − 𝜋) 𝑒2 𝑛 = 1.962 ∗ 0.096 ∗ 0.904 0.042 = 209 𝐿𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎 𝑡𝑒𝑛𝑑𝑟á 209 𝑝𝑒𝑟𝑠𝑜𝑛𝑎𝑠
  64. 64. Resolución Z 2 2 0.042 1.96 0.096x0.904 p̂q̂ e2  208,4  209  n  2  Es decir la muestra tendrá que ser de 209 personas.
  65. 65. Resolución Si p y q fueran desconocidos Es decir si no hubieran sido estimados a partir de una muestra preliminar y N fuera desconocido; el tamaño de muestra sería: 1.962 0.5x0.5 0.042  600.25  601 n  Es decir la muestra tendrá que ser de 601 personas.
  66. 66. El presidente proporción poblacional que está de acuerdo con de México quiere que se estime la su política económica actual, así como que esa estimación esté dentro de una aproximación de 2% de la proporción verdadera, con un nivel de confianza de 95%. El secretario de Gobernación estimó que la proporción que apoya la política económica es de 0.7. a) ¿Qué tan grande debe ser la muestra? b) ¿Qué tan grande debe ser la muestra si el secretario de Gobernación no realizara esa estimación? Ejemplo 4 https://bit.ly/3CyOvaQ
  67. 67. 𝑃𝑂𝐵𝐿𝐴𝐶𝐼Ó𝑁 𝑀𝑈𝐸𝑆𝑇𝑅𝐴 𝑒 = 2% 𝜋 = 0.70 1 − 𝜋 = 0.30 𝑛 = 𝑍𝛼/2 2 ∗ 𝜋 ∗ (1 − 𝜋) 𝑒2 𝑛 = 1.962 ∗ 0.70 ∗ 0.30 0.022 = 2017
  68. 68. 𝑛 = α/2 𝑍2 𝑝Ƹ 𝑞 ො 𝑒2 = (1.96)20.7𝑥0.3 0.022 = 2016.84 ≈ 2017 La Presidencia debe tomar una muestra de 2017 personas para poder obtener una estimación de la proporción real de personas que están de acuerdo con su política económica. a) Resolución
  69. 69. b) 𝑛 = α/2 𝑍2 𝑝Ƹ 𝑞 ො 𝑒2 = (1.96)20.5𝑥0.5 0.022 = 2041 La Presidencia debe tomar una muestra de 2041 personas para poder obtener una estimación de la proporción real de personas que están de acuerdo con su política económica. Resolución
  70. 70. APLIQUEMOS LO APRENDIDO 1) El departamento de personal de una compañía grande requiere estimar los gastos familiares en odontología de sus empleados para determinar la factibilidad de proporcionarles un plan de seguro dental. Por estudios realizados anteriormente se determinó que dichos gastos tenían una desviación estándar de 130 dólares. ¿Qué tamaño tendría que ser la muestra para estimar la media con un 95% de confiabilidad y con un margen de error de 30 dólares?
  71. 71. 𝑃𝑂𝐵𝐿𝐴𝐶𝐼Ó𝑁 𝑀𝑈𝐸𝑆𝑇𝑅𝐴 𝑒 = 30 𝑛 = 𝑍𝛼/2 ∗ 𝜎 𝑒 2 𝜎 = 130 𝑛 = 1.96 ∗ 130 30 2 = 72 𝑆𝑒 𝑛𝑒𝑐𝑒𝑠𝑖𝑡𝑎 72 𝑝𝑒𝑟𝑠𝑜𝑛𝑎𝑠 𝑝𝑎𝑟𝑎 𝑙𝑜𝑔𝑟𝑎𝑟 𝑒𝑙 𝑜𝑏𝑗𝑒𝑡𝑖𝑣𝑜 𝑛 = 𝑍𝛼/2 2 ∗ 𝑁 ∗ 𝜎2 𝑍𝛼/2 2 ∗ 𝜎2 + (𝑁 − 1)𝑒2
  72. 72. 2) Solo una parte de los pacientes que sufren de un determinado síndrome neurológico consiguen una curación completa. Si de 65 pacientes observados se han curado 41. ¿Qué número de pacientes habría que observar para estimar la proporción de pacientes curados con un margen de error igual a 0.04 y una confianza del 95%?
  73. 73. 𝑃𝑂𝐵𝐿𝐴𝐶𝐼Ó𝑁 𝑀𝑈𝐸𝑆𝑇𝑅𝐴 𝑒 = 0.04 𝜋 = 41 65 1 − 𝜋 = 24 65 𝑛 = 𝑍𝛼/2 2 ∗ 𝜋 ∗ (1 − 𝜋) 𝑒2 𝑛 = 1.962 ∗ 41 65 ∗ 24 65 0.042 = 559 𝐶𝑜𝑛 𝑢𝑛 𝑛𝑖𝑣𝑒𝑙 𝑑𝑒 𝑐𝑜𝑛𝑓𝑖𝑎𝑛𝑧𝑎 𝑑𝑒𝑙 95%, 𝑙𝑜𝑠 𝑛ú𝑚𝑒𝑟𝑜𝑠 𝑝𝑎𝑐𝑖𝑒𝑛𝑡𝑒𝑠 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑑𝑜𝑠 𝑠𝑒𝑟á𝑛 559. 𝑃𝑟𝑜𝑝𝑜𝑟𝑐𝑖ó𝑛 𝑑𝑒 𝑝𝑒𝑟𝑠𝑜𝑛𝑎𝑠 𝑐𝑢𝑟𝑎𝑑𝑎𝑠 𝑃𝑟𝑜𝑝𝑜𝑟𝑐𝑖ó𝑛 𝑑𝑒 𝑝𝑒𝑟𝑠𝑜𝑛𝑎𝑠 𝑛𝑜 𝑐𝑢𝑟𝑎𝑑𝑎𝑠
  74. 74. 3) ¿A cuántas familias tendríamos que encuestar para conocer la preferencia del mercado en cuanto a las marcas de shampoo para bebé, si se desconoce la población total?. Seguridad = 99%, Precisión = 3%. Proporción esperada: asumamos que puede ser próxima al 5%.
  75. 75. 𝑃𝑂𝐵𝐿𝐴𝐶𝐼Ó𝑁 𝑀𝑈𝐸𝑆𝑇𝑅𝐴 𝑒 = 0.03 𝜋 = 0.05 1 − 𝜋 = 0.95 𝑛 = 𝑍𝛼/2 2 ∗ 𝜋 ∗ (1 − 𝜋) 𝑒2 𝐶𝑜𝑛 𝑢𝑛 𝑛𝑖𝑣𝑒𝑙 𝑑𝑒 𝑐𝑜𝑛𝑓𝑖𝑎𝑛𝑧𝑎 𝑑𝑒𝑙 99%, 𝑡𝑒𝑛𝑑𝑟𝑒𝑚𝑜𝑠 𝑞𝑢𝑒 𝑒𝑛𝑐𝑢𝑒𝑠𝑡𝑎𝑟 𝑎 351 𝑓𝑎𝑚𝑖𝑙𝑖𝑎𝑠 𝑐𝑜𝑛 𝑟𝑒𝑠𝑝𝑒𝑐𝑡𝑜 𝑎 𝑙𝑎 𝑚𝑎𝑟𝑐𝑎 𝑑𝑒 𝑠ℎ𝑎𝑚𝑝𝑜𝑜 𝑞𝑢𝑒 𝑢𝑠𝑎𝑛. 𝑛 = 2.582 ∗ 0.05 ∗ 0.95 0.032 = 351
  76. 76. 4)Se van a realizar elecciones para elegir al Rector de cierta universidad, que consta de 8 facultades, el total de alumnos es de 10,100. Se quiere llevar a cabo una encuesta para saber cual es la tendencia del voto entre los alumnos. Se requiere tener una confianza del 95% y un porcentaje de error del 3%. a) ¿Cuál es la población de estudio? b) ¿De qué tamaño es la población de estudio? c) ¿Cuál es la variable a analizar? d) Determinar el tamaño de la muestra.
  77. 77. ¿Cuál es la población de estudio? 𝐶𝑎𝑛𝑡𝑖𝑑𝑎𝑑 𝑑𝑒 𝑒𝑠𝑡𝑢𝑑𝑖𝑎𝑛𝑡𝑒𝑠 𝑑𝑒 𝑐𝑖𝑒𝑟𝑡𝑎 𝑢𝑛𝑖𝑣𝑒𝑟𝑠𝑖𝑑𝑎𝑑, 𝑞𝑢𝑒 𝑐𝑜𝑛𝑠𝑡𝑎 𝑑𝑒 8 𝑓𝑎𝑐𝑢𝑙𝑡𝑎𝑑𝑒𝑠. ¿De qué tamaño es la población de estudio? 𝐸𝑙 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑒𝑠𝑡𝑢𝑑𝑖𝑎𝑛𝑡𝑒𝑠 𝑑𝑒 𝑐𝑖𝑒𝑟𝑡𝑎 𝑢𝑛𝑖𝑣𝑒𝑟𝑠𝑖𝑑𝑎𝑑 𝑞𝑢𝑒 𝑐𝑜𝑛𝑠𝑡𝑎 𝑑𝑒 8 𝑓𝑎𝑐𝑢𝑙𝑡𝑎𝑑𝑒𝑠 𝑒𝑠 𝑑𝑒 10100 ¿Cuál es la variable a analizar? 𝑃𝑟𝑒𝑓𝑒𝑟𝑒𝑛𝑐𝑖𝑎 𝑑𝑒 𝑒𝑙𝑒𝑐𝑐𝑖ó𝑛 𝑑𝑒𝑙 𝑟𝑒𝑐𝑡𝑜𝑟 𝑑𝑒 𝑢𝑛𝑎 𝑢𝑛𝑖𝑣𝑒𝑟𝑠𝑖𝑑𝑎𝑑 Determinar el tamaño de la muestra. 𝑃𝑂𝐵𝐿𝐴𝐶𝐼Ó𝑁 𝑀𝑈𝐸𝑆𝑇𝑅𝐴 𝑒 = 0.03 𝜋 = 0.5 1 − 𝜋 = 0.5 𝑁 = 10100 𝑛 = 𝑍𝛼/2 2 ∗ 𝑁 ∗ 𝜋 ∗ (1 − 𝜋) 𝑍𝛼/2 2 ∗ 𝜋 ∗ (1 − 𝜋) + (𝑁 − 1)𝑒2 𝑛 = 1.962 ∗ 10100 ∗ 0.5 ∗ 0.5 1.962 ∗ 0.5 ∗ 0.5 + (10100 − 1)(0.03)2 = 965
  78. 78. INTEGREMOS LO APRENDIDO https://bit.ly/3pKZIzI • ¿Qué mide el error de estimación o margen de error o grado de precisión? • ¿Qué ventajas presenta el muestreo probabilístico? ¿Y el no probabilístico? • ¿Qué valores asumen p y q cuando estos no hubieran sido estimados anteriormente?
  79. 79. Actividad Asincrónica Resolver el cuestionariodelasemana10
  80. 80. Referencias bibliográficas

×