El documento describe cómo construir intervalos de confianza para la media poblacional. Explica que un intervalo de confianza es un rango de valores que incluye el verdadero valor del parámetro con una probabilidad determinada (generalmente 95%). También describe cómo, si la variable tiene una distribución normal, se puede usar la desviación estándar para calcular un intervalo que contenga la media poblacional el 95% de las veces.
1. INICIO 2DA
UNIDAD
INTERVALOS DE CONFIANZA PARA LA MEDIA POBLACIONAL
CONFIANZA
En el contexto de estimar un parámetro poblacional, un intervalo de confianza
es un rango de valores (calculado en una muestra) en el cual se encuentra el
verdadero valor del parámetro, con una probabilidad determinada.
La probabilidad de que el verdadero valor del parámetro se encuentre en el
intervalo construido se denomina nivel de confianza, y se denota 1- . La
probabilidad de equivocarnos se llama nivel de significancia y se simboliza .
Generalmente se construyen intervalos con confianza 1- =95% (o
significancia =5%). Menos frecuentes son los intervalos con =10% o =1%.
Para construir un intervalo de confianza, se puede comprobar que la
distribución Normal Estándar cumple 1:
P(-1.96 < z < 1.96) = 0.95
(lo anterior se puede comprobar con una tabla de probabilidades o un
programa computacional que calcule probabilidades normales).Si una variable
X tiene distribución N( , ), entonces el 95% de las veces se cumple:
Despejando en la ecuación se tiene:
El resultado es un intervalo que incluye al el 95% de las veces. Es decir, es
un intervalo de confianza al 95% para la media cuando la variable X es
normal y es conocido.
Ejemplo
2. Intervalo de confianza para la media de una población
De una población de media y desviación típica se pueden
tomar muestras de elementos. Cada una de estas muestras tiene a su vez
una media ( ). Se puede demostrar que la media de todas las medias
muestrales coincide con la media poblacional:3
Pero además, si el tamaño de las muestras es lo suficientemente grande,4
la
distribución de medias muestrales es, prácticamente, una distribución
normal (o gaussiana) con media μ y una desviación típica dada por la siguiente
expresión: . Esto se representa como sigue: .
Si estandarizamos, se sigue que:
En una distribución Z ~ N(0, 1) puede calcularse fácilmente un intervalo dentro
del cual caigan un determinado porcentaje de las observaciones, esto es, es
sencillo hallar z1 y z2 tales que P[z1≤ z ≤ z2] = 1 - α, donde (1 - α)·100 es el
porcentaje deseado (véase el uso de las tablas en una distribución normal).
Se desea obtener una expresión tal que
En esta distribución normal de medias se puede calcular el intervalo de
confianza donde se encontrará la media poblacional si sólo se conoce una
media muestral ( ), con una confianza determinada. Habitualmente se
manejan valores de confianza del 95 y del 99 por ciento. A este valor se le
llamará (debido a que es el error que se cometerá, un término
opuesto).
Para ello se necesita calcular el punto —o, mejor dicho, su versión
estandarizada o valor crítico— junto con su "opuesto en la
distribución" . Estos puntos delimitan la probabilidad para el intervalo,
como se muestra en la siguiente imagen: