1. El documento trata sobre la estimación de parámetros estadísticos como medias y proporciones poblacionales a partir de datos de una muestra. 2. Explica los conceptos de estimación puntual e intervalal y cómo calcular los límites superiores e inferiores de un intervalo de confianza. 3. Incluye ejemplos sobre cómo estimar la media poblacional de gastos y el tiempo promedio de espera en una clínica veterinaria a partir de datos muestrales.
1. ESTIMACIÓN DE
PARÁMETROS
𝐸𝑆 𝑃
𝐸𝑆 𝑋
Facultad de Ciencias de la Salud
ESTADÍSTICA
FACULTAD DE CIENCIAS DE LA SALUD – ESCUELA ACADÉMICO PROFESIONAL DE MEDICINA
VETERINARIA Y ZOOTECNIA
Dr. Mayhuasca Salgado Ronald
Docente
2. Al término de la clase el estudiante conocerá las bases de la
estadística inferencial sobre estimaciones puntuales y por intervalos
tanto de medias como de proporciones poblacionales
Propósito
3. Problema tipo
Se desea estimar la
proporción de pollos
desnutridos menores de 5
semanas al 95% de IC, de
una determinada
comunidad. Para tal efecto,
se selecciona una muestra
de 100 pollos menores de
05 semanas y se determina
que 45 están desnutridos.
4. ¿Por qué hacemos inferencia estadística?
1. Para conocer y concluir algo acerca de una población, a partir de los
datos de una muestra.
2. Si la muestra es aleatoria, los resultados de los datos describen lo que
ocurre en esa muestra, pero no en la población.
3. Entonces tenemos que inferir (suponer) los resultados de la muestra
hacia la población con un cierto margen de incertidumbre (error)
4. Ese proceso de llama INFERENCIA ESTADÍSTICA
Bejarano L, Mormontoy W, Tipacti C. Muestreo e inferencia
estadística en ciencias de la salud. Lima: Unión;2006.
Es el proceso por el que se obtienen conclusiones probabilísticas
en relación a una población al valerse de la información
proporcionada por una muestra de esa población
6. Inferencia es un proceso lógico de
naturaleza deductiva o inductiva
que permite sacar una conclusión
a partir de una premisa
Procedimiento que permite realizar afirmaciones de
naturaleza probabilística respecto a una población, en
base a los resultados obtenidos en una muestra
seleccionada de esa población.
Como las poblaciones son descritas por medidas numéricas
descriptivas llamadas parámetros, se puede hacer
inferencias acerca de la población haciendo inferencias
respecto a sus parámetros
Inferencia estadística
7. INFERENCIA
ESTADÍSTICA
Estimación de
parámetros
Prueba de
hipótesis
Por punto
Por intervalosCalcular un valor que
corresponde a una
característica de la población
De orden cuantitativo.
Establece conclusiones sobre
alguna afirmación o supuesto
(hipótesis)
Establece un rango
donde se supone está el
parámetro
Margen de error
EXISTE
Áreas de la inferencia estadística
8. De parámetros y estimadores
Parámetro Estimador Descripción
µ 𝑋 Media aritmética
σ2 S2 Varianza
µ1 - µ2 𝑋1 - 𝑋2 Diferencia de
medias
π p Proporción
π1 – π2 p1 – p2 Diferencia de
proporciones
9. Se usan las medidas de la muestra para calcular un único
valor numérico que es la estimación puntual del
parámetro poblacional
Las medidas de la muestra pueden también usarse para calcular
dos valores numéricos que definen un intervalo el cual, con
un cierto nivel de confianza, se considera que incluye al
parámetro
1. Estimación por punto
2. Estimación por intervalo
10. Se usan las medidas de la muestra para calcular un único
valor numérico que es la estimación puntual del
parámetro poblacional
En un estudio la media y la desviación estándar de las edades de una
muestra de pacientes fueron (33±5 años). Entonces 33 años es la
estimación puntual de la edad promedio poblacional.
Pregunta:
¿cuál es la estimación puntual de la desviación estándar y de la varianza
de la población de dichos pacientes?
Ejemplo:
1. Estimación por punto
11. Se necesita estimar el gasto promedio mensual en capacitaciones de los
zootecnistas de las diferentes unidades de crianza de animales mayores
de la región. Para tal efecto se recurre a una muestra aleatoria de 25
zootecnistas y se obtienen los siguientes resultados:
Media: 1 600 nuevos soles
D.E: 320
Ejemplo 02:
1. Estimación por punto
El gasto promedio de todos los zootecnistas está
representado por µ (parámetro poblacional) y la
estimación por punto de este parámetro sería:
𝑋=1600 n.s.
pero…
… ese valor no es estable, por que si tomamos otra
muestra van a haber resultados distintos, ante ello
es mejor determinar un INTERVALO donde
“caigan” las distintas medidas paramétricas con un
cierto grado de seguridad
12. Las medidas de la muestra pueden también usarse para calcular dos
valores numéricos que definen un intervalo el cual, con un cierto nivel de
confianza, se considera que incluye al parámetro
Límite
inferior
Límite
superior
A veces el parámetro no se halla en el intervalo
cuando la muestra no es representativa
Una muestra debe incluir al
parámetro
2. Estimación por intervalo
13. La probabilidad de que una estimación por intervalo incluya el parámetro
se denomina nivel de confianza
El modelo general de estimación por intervalo de un
parámetro cualquiera, es:
Al restar el producto del estimador se obtiene el límite
inferior del intervalo (LI) y al sumar se obtiene el límite
superior (LS). La expresión final de la estimación de un
parámetro cualquiera es:
IC 95% [LI;LS]
PARÁMETRO = ESTIMADOR ± COEFICIENTE DE CONFIANZA x ERROR ESTÁNDAR DEL ESTIMADOR
El margen de error es grande
cuando la muestra es pequeña
A este producto se llama MARGEN DE
ERROR O PRECISIÓN DEL ESTIMADOR
O ERROR ABSOLUTO
Parámetro = estimador ± precisión del estimador
2. Estimación por intervalo
14. Error muestral:
Error y sus tipos
Es la diferencia entre el valor de un estadístico y su
parámetro correspondiente, por ejemplo:
Son diversas las causas que lo generan y pueden
ser muestrales y no muestrales
Además su cálculo varia cuando se
conoce y desconoce la población (N)
|μ - 𝑥 | |π – p |
Error no muestral:
Si tomo varias muestras de una población, para cada una habrá una media
distinta, esa variabilidad entre muestra y muestra se llama error muestral y
se calcula a través de una medida de dispersión llamada error estándar del
estimador
Surge de la selección de la muestra, del recuento de toda la población;
comprende los sesgos y equivocaciones durante la recolección de datos,
codificación y procesamiento de datos.
15. El error estándar estimado de la media con población finita es:
Los errores cuando conocemos N
Cuantitativo
𝐸𝑆 𝑋
=
𝑆
𝑛
√
𝑁 − 𝑛
𝑁
Para el 𝐸𝑆 𝑋
de toda la población
simplemente multiplicamos por N
El error estándar estimado de la media con población finita es:
Cualitativo
𝐸𝑆 𝑝
=
𝑝𝑞
𝑛
√
𝑁 − 𝑛
𝑁
Para el 𝐸𝑆 𝑝 de toda la población
simplemente multiplicamos por N
16. μ = 𝑥 ± Z 1-α/2 .
σ
√𝑛
Media aritmética
(promedio)
poblacional
Media aritmética
(promedio) muestral
Coeficiente de confiabilidad:
Distribución Z
Desviación estándar
poblacional
Límite superior
Límite inferior
Parámetro = estimador ± precisión del estimador
1. Estimación de la media poblacional
Error estándar
Parámetro = estimador ± E (error absoluto)
Cuando conocemos la varianza poblacional (σ2) y n ≥ 30
17. μ = 𝑥 ± Z 1-α/2 .
𝑆
√𝑛
Media aritmética
(promedio)
poblacional
Media aritmética
(promedio) muestral
Coeficiente de confiabilidad:
Distribución Z
Desviación estándar
muestral
Límite superior
Límite inferior
Parámetro = estimador ± precisión del estimador
1. Estimación de la media poblacional
Error estándar (N
desconocido)
Parámetro = estimador ± E (error absoluto)
Cuando NO conocemos la varianza poblacional (σ2) y n ≥ 30
18. μ = 𝑥 ± tn-1.
𝑆
√𝑛
Media aritmética
(promedio)
poblacional
Media aritmética
(promedio) muestral
Coeficiente de confiabilidad:
Distribución T
Desviación estándar
muestral
Límite superior
Límite inferior
Parámetro = estimador ± precisión del estimador
1. Estimación de la media poblacional
Error estándar (N desconocido)
Parámetro = estimador ± E (error absoluto)
Cuando NO conocemos la varianza poblacional (σ2) y n < 30
19. Donde tn-1 es el coeficiente de confiabilidad, su valor se obtiene de la tabla «t» de Student
con [n-1] grados de libertad para el nivel de confianza o de significación deseado.
μ = 𝑥 ± tn-1.
𝑆
√𝑛
Límite superior
Límite inferior
Características de la distribución
«t» de Student:
• Conformada por una familia de curvas simétricas respecto a la
perpendicular en el punto t=0
• Cada curva es diferente de otra en base a los grados de
libertad
• A medida que n aumenta, «t» se aproxima a la normal
estándar Z.
• Su curva es mas “chata” que la normal y tiene colas más
anchas y su μ=0
1. Estimación de la media poblacional
20. Distribución «t» de Student:
• Conformada por una familia de curvas simétricas respecto a la
perpendicular en el punto t=0
• Cada curva es diferente de otra en base a los grados de libertad
• A medida que n aumenta, «t» se aproxima a la normal estándar Z.
21. Se necesita estimar el gasto promedio mensual en capacitaciones de los
zootecnistas de las diferentes unidades de producción de animales mayores de la
región. Para tal efecto se recurre a una muestra aleatoria de 25 zootecnistas y se
obtienen los siguientes resultados:
Media: 1 600 nuevos soles
D.E: 320
Del ejemplo anterior:
Estimación por intervalo
Aquí la distribución t, posee 25-1 grados de libertad
y para un nivel de significación de 0,05 y para una
prueba de dos colas el t(24)=2,064
Operacionalizando tendremos para:
Li=1467,9 n.s.
Ls= 1732,1 n.s.
Se le asigna un intervalo de confianza de 95%
μ = 𝑥 ± tn-1.
𝑆
√𝑛
22. Se desea estimar el tiempo promedio de espera de una clínica
privada veterinaria. En una muestra de 61 usuarios se obtuvo
una 𝑋= 18,7 y S=6,8 minutos. Estimar μ con 95% de confianza.
EJEMPLO 02
Solución
Como no se conoce σ (desviación estándar poblacional), el
error estándar de la media muestral se obtiene con S. Entonces:Supuestos:
aleatoriedad y
normalidad
μ = 𝑥 ± tn-1.
𝑆
√𝑛
μ = 18,7± t61-1.
6,8
√61
Estimación de la media poblacional
Vamos usar la distribución T, pese a que n>30 para comparar
23. Se desea estimar el tiempo promedio de espera de una clínica privada veterinaria. En
una muestra de 61 usuarios se obtuvo una 𝑋= 18,7 y S=6,8 minutos. Estimar μ con 95%
de confianza.
EJEMPLO
En este caso, para 60
grados de libertad y un
nivel de significación
bilateral de 0,05 (α =
0,05), se tiene t60=2,00,
luego:
μ = 18,7± t61-1.
6,8
√61
μ = 18,7± t60.
6,8
√61
μ = 18,7± (2,00).
6,8
√61
μ = 18,7± 1,74
20,4min
17,0min
Estimación de la media poblacional (μ)
24. Nota: la cantidad ± 1,74
recibe el nombre de
precisión de la estimación o
margen de error
Interpretación
El tiempo promedio de espera, para la atención médica en la
población de pacientes que acude a la clínica veterinaria, se
encuentra entre 17,0 y 20,4 minutos, con un nivel de
confianza de 95%.
Expresión en informe: IC 95% [17,0;20,4] minutos
Estimación de la media poblacional (μ)
Se desea estimar el tiempo promedio de espera de una clínica privada
veterinaria. En una muestra de 61 usuarios se obtuvo una 𝑋= 18,7 y S=6,8
minutos. Estimar μ con 95% de confianza.
EJEMPLO
μ = 18,7± 1,705
20,40min
16,99min
Al usar la distribución Z, los valores
serían:
μ = 18,7± 1,74
20,4min
17,0min
25. π = p ± Z α/2. √
𝑝𝑞
𝑛
Proporción
poblacional
Proporción
muestral
Coeficiente de confiabilidad:
Distribución Z (bilateral)
p: proporción esperada de individuos
con la variable de interés
Límite superior
Límite inferior
Precisión del estimador (margen de error)
Error estándar (N
desconocido)
PARÁMETRO
ESTIMADOR
Parámetro = estimador ± precisión del estimador
q =1-p
Estimación de una proporción poblacional (π)
N grande o infinita (desconocida)
26. π = p ± Z α/2. √
𝑝𝑞
𝑛
(
𝑁−𝑛
𝑁−1
)Proporción
poblacional
Proporción
muestral
Coeficiente de confiabilidad:
Distribución Z (bilateral)
p: proporción esperada de individuos
con la variable de interés
Límite superior
Límite inferior
Precisión del estimador (margen de error)
Error estándar (N
conocido)
PARÁMETRO
ESTIMADOR
Parámetro = estimador ± precisión del estimador
q =1-p
Estimación de una proporción poblacional (π)
N finita (o conocida)
27. Para estimar la prevalencia de obesidad en una población de pacientes de
sexo femenino se tomó una muestra de 120 individuos de esa población y
se encontró que 54 presentaban obesidad. Estimar la prevalencia
poblacional con 95% de confianza.
Solución
Supuestos: muestra
probabilística y n > 30
π = p ± Zα/2. √
𝑝𝑞
𝑛p = 54/120 = 0,45
q = 1- 0,45
n = 120
α= 1-0,95= 0,05 π = 0,45 ± Z1-0,95. √
0,45 (0,55)
120
π = 0,45 ± Z0,05. √
0,45 (0,55)
120
π = 0,45 ± 1,96. √
(0,2475)
120
Z(1-α) : Valor correspondiente
en la distribución Z para un
nivel de confianza α=…
Estimación de una proporción poblacional (π)
EJEMPLO
Nivel 90% 95% 99%
α 0,10 0,05 0,01
Zα
1,28 1,64 2,33
Zα/2
1,64 1,96 2,57Bilateral
Vemos que no conocemos N
28. p = 54/120 = 0,45
q = 1- 0,45
n = 120
α= 1-0,95= 0,05
π = 0,45 ± 1,96. √
(0,2475)
120
π = 0,45 ± 0,089
0,539
0,361
Expresión en informe:
IC 95% [0,361;0,539] IC 95% [36,1;53,9] %
La prevalencia de obesidad en la población de pacientes de sexo
femenino se encuentra entre 36,1 y 53,9%, con 95% de confianza.Respuesta:
Para estimar la prevalencia de obesidad en una población de pacientes de
sexo femenino se tomó una muestra de 120 individuos de esa población y
se encontró que 54 presentaban obesidad. Estimar la prevalencia
poblacional con 95% de confianza.
Estimación de una proporción poblacional (π)
EJEMPLO
29. Para la aplicación de las estimaciones se requieren cumplir los
supuestos de normalidad y aleatoriedad
Las estimaciones permiten el ahorro de recursos y tiempo en el
proceso de investigación
Conclusiones
30. Problema tipo
Se desea estimar la
proporción de pollos
desnutridos menores de 5
semanas al 95% de IC, de
una determinada granja.
Para tal efecto, se
selecciona una muestra de
100 pollos menores de 05
semanas y se determina
que 45 están desnutridos.
31. Tabla de valores críticos de T de Student
g.l
Nivel de significación para prueba de una cola
.10 .05 .025 .01 .005 .0005
Nivel de significación para prueba de dos colas
.20 .10 .05 .02 .01 .001
g.l
Nivel de significación para prueba de una cola
.10 .05 .025 .01 .005 .0005
Nivel de significación para prueba de dos colas
.20 .10 .05 .02 .01 .001