Un intervalo de confianza es un rango de valores que se estima con una cierta probabilidad incluye un parámetro desconocido de la población, basado en los datos de una muestra. El nivel de confianza depende del tamaño del intervalo, siendo mayor para rangos más amplios. Los intervalos de confianza se usan comúnmente para verificar hipótesis sobre parámetros poblacionales como la media.
2. INTERVALO DE CONFIANZA
En estadística, se llama intervalo de confianza a un par de números entre
los cuales se estima que estará cierto valor desconocido con una
determinada probabilidad de acierto. Formalmente, estos números
determinan un intervalo, que se calcula a partir de datos de una
muestra, y el valor desconocido es un parámetro poblacional. La
probabilidad de éxito en la estimación se representa con 1 - α y se
denomina nivel de confianza. En estas circunstancias, α es el llamado
error aleatorio o nivel de significación, esto es, una medida de las
posibilidades de fallar en la estimación mediante tal intervalo.1
El nivel de confianza y la amplitud del intervalo varían conjuntamente, de
forma que un intervalo más amplio tendrá más posibilidades de acierto
(mayor nivel de confianza), mientras que para un intervalo más
pequeño, que ofrece una estimación más precisa, aumentan sus
posibilidades de error.
3. Para la construcción de un determinado intervalo de confianza es
necesario conocer la distribución teórica que sigue el parámetro
a estimar, θ. Es habitual que el parámetro presente una
distribución normal. También pueden construirse intervalos de
confianza con la desigualdad de Chebyshov.
En definitiva, un intervalo de confianza al 1 - α por ciento para la
estimación de un parámetro poblacional θ que sigue una
determinada distribución de probabilidad, es una expresión del
tipo [θ1, θ2] tal que P[θ1 ≤ θ ≤ θ2] = 1 - α, donde P es la función
de distribución de probabilidad de θ.
4. INTERVALO DE CONFIANZA PARA LA MEDIA DE
UNA POBLACIÓN
De una población de media y desviación típica se pueden tomar muestras
de elementos. Cada una de estas muestras tiene a su vez una media ().
Se puede demostrar que la media de todas las medias muestrales
coincide con la media poblacional:2
Pero además, si el tamaño de las muestras es lo suficientemente grande,3
la distribución de medias muestrales es, prácticamente, una
distribución normal (o gaussiana) con media μ y una desviación típica
dada por la siguiente expresión.
5. La probabilidad de que el verdadero valor del parámetro se
encuentre en el intervalo construido se denomina nivel de
confianza, y se denota 1-. La probabilidad de equivocarnos se
llama nivel de significancia y se simboliza . Generalmente se
construyen intervalos con confianza 1-=95% (o significancia
=5%). Menos frecuentes son los intervalos con =10% o =1%.
6. Para construir un intervalo de confianza, se puede comprobar que
la distribución Normal Estándar cumple 1:
P(-1.96 < z < 1.96) = 0.95
(lo anterior se puede comprobar con una tabla de probabilidades o
un programa computacional que calcule probabilidades
normales).
7. Luego, si una variable X tiene distribución N(,), entonces el 95% de
las veces se cumple:
Despejando en la ecuación se tiene:
El resultado es un intervalo que incluye al el 95% de las veces. Es
decir, es un intervalo de confianza al 95% para la media cuando
la variable X es normal y es conocido.
8. USO DE INTERVALOS DE CONFIANZA PARA VERIFICAR
HIPÓTESIS.
Los intervalos de confianza permiten verificar hipótesis planteadas
respecto a parámetros poblacionales.
Por ejemplo, supongamos que se plantea la hipótesis de que el promedio
de peso de nacimiento de cierta población es igual a la media nacional
de 3250 gramos.
Al tomar una muestra de 30 recién nacidos de la población en estudio, se
obtuvo:
x= 2930
s= 450
n= 30
9. Al construir un intervalo de 95% de confianza para la media poblacional,
se obtiene:
Luego, el peso de nacimiento varía entre 2769 y 3091 gramos, con una
confianza de 95%.
Como el intervalo no incluye el valor =3250 gramos planteado en la
hipótesis, entonces esta es rechazada con confianza 95% (o un valor
p menor a 0,5).