2. Intervalos de confianza
En estadística, se llama intervalo de confianza a un par de números entre los cuales se estima que
estará cierto valor desconocido con una determinada probabilidad de acierto. Formalmente, estos
números determinan un intervalo, que se calcula a partir de datos de una muestra, y el valor
desconocido es un parámetro poblacional. La probabilidad de éxito en la estimación se representa
con 1 - α y se denomina nivel de confianza. En estas circunstancias, α es el llamado error
aleatorio o nivel de significación, esto es, una medida de las posibilidades de fallar en la estimación
1
mediante tal intervalo.
El nivel de confianza y la amplitud del intervalo varían conjuntamente, de forma que un intervalo
más amplio tendrá más posibilidades de acierto (mayor nivel de confianza), mientras que para un
intervalo más pequeño, que ofrece una estimación más precisa, aumentan sus posibilidades de
error.
Para la construcción de un determinado intervalo de confianza es necesario conocer
la distribución teórica que sigue el parámetro a estimar,θ. Es habitual que el parámetro presente
una distribución normal. También pueden construirse intervalos de confianza con la desigualdad de
Chebyshov.
En definitiva, un intervalo de confianza al 1 - α por ciento para la estimación de un parámetro
poblacional θ que sigue una determinadadistribución de probabilidad, es una expresión del tipo
[θ1, θ2] tal que P[θ1 ≤ θ ≤ θ2] = 1 - α, donde P es la función de distribución de probabilidad de θ.
Intervalo de confianza para la media de una población
De una población de media y desviación típica se pueden tomar muestras de elementos.
Cada una de estas muestras tiene a su vez una media ( ). Se puede demostrar que la media de
2
todas las medias muestrales coincide con la media poblacional:
3
Pero además, si el tamaño de las muestras es lo suficientemente grande, la distribución de
medias muestrales es, prácticamente, unadistribución normal (o gaussiana) con media μ y una
desviación típica dada por la siguiente expresión: . Esto se representa como
sigue: . Si estandarizamos, se sigue que:
En una distribución Z ~ N(0, 1) puede calcularse fácilmente un intervalo dentro del cual caigan un
determinado porcentaje de las observaciones, esto es, es sencillo hallar z1 y z2 tales que P[z1 ≤ z
≤ z2] = 1 - α, donde (1 - α)·100 es el porcentaje deseado (véase el uso de las tablas en una
distribución normal).
Se desea obtener una expresión tal que
3. En esta distribución normal de medias se puede calcular el intervalo de confianza donde se
encontrará la media poblacional si sólo se conoce una media muestral ( ), con una confianza
determinada. Habitualmente se manejan valores de confianza del 95 y del 99 por ciento. A este
valor se le llamará (debido a que es el error que se cometerá, un término opuesto).
Para ello se necesita calcular el punto —o, mejor dicho, su versión estandarizada
o valor crítico— junto con su "opuesto en la distribución" . Estos puntos delimitan la
probabilidad para el intervalo, como se muestra en la siguiente imagen:
Dicho punto es el número tal que:
Y en la versión estandarizada se cumple que:
Así:
Haciendo operaciones es posible despejar para obtener el intervalo:
De lo cual se obtendrá el intervalo de confianza:
4. Obsérvese que el intervalo de confianza viene dado por la media muestra ± el producto
del valor crítico por el error estándar .
4
Si no se conoce y n es grande (habitualmente se toma n ≥ 30):
, donde s es la desviación típica de una muestra.
Aproximaciones para el valor para los niveles de confianza estándar son 1,96
5
para y 2,576 para .
Intervalo de confianza para una proporción
El intervalo de confianza para estimar una proporción p, conocida una proporción muestral pn de
una muestra de tamaño n, a un nivel de confianza del (1-α)·100% es:
5. Problemas
1- Una empresa está interesada en lanzar un nuevo producto al mercado. Tras
realizar una campaña publicitaria, se toma la muestra de 1000 habitantes, de los
cuales, 25 no conocían el producto. A un nivel de significación del 1% ¿apoya el
estudio las siguientes hipótesis?
a. Más del 3% de la población no conoce el nuevo producto.
b. Menos del 2% de la población no conoce el nuevo producto
Datos:
n = 1000
x = 25
Donde:
x = ocurrencias
n = observaciones
= proporción de la muestra
= proporción propuesta
Solución:
a)
a = 0,01
6. 2- Un gerente de ventas de libros universitarios afirma que en promedio sus
representantes de ventas realiza 40 visitas a profesores por semana. Varios de
estos representantes piensan que realizan un número de visitas promedio superior
a 40. Una muestra tomada al azar durante 8 semanas reveló un promedio de 42
visitas semanales y una desviación estándar de 2 visitas. Utilice un nivel de
confianza del 99% para aclarar esta cuestión.
Datos:
(= 40
n=8
Nivel de confianza del 99%
Nivel de significación = (100%-99%)/2 = 0,5% = 0,005
Solución:
H0: (= 40
H1: (> 40
Grados de libertad: n-1 = 8-1 =7
a = 0,005
3-Un investigador de mercados y hábitos de comportamiento afirma que
el tiempo que los niños de tres a cinco años dedican a ver la televisión cada
semana se distribuye normalmente con una media de 22 horas y desviación
estándar 6 horas. Frente a este estudio, una empresa de investigación de
mercados cree que la media es mayor y para probar su hipótesis toma una
7. muestra de 64 observaciones procedentes de la misma población, obteniendo
como resultado una media de 25. Si se utiliza un nivel de significación del 5%.
Verifique si la afirmación del investigador es realmente cierta.
Datos:
n = 64
a = 5% = 0,05
Solución:
H0: (= 22
H1: (> 22
a = 0,05
4-Cuando las ventas medias, por establecimiento autorizado, de una marca de
relojes caen por debajo de las 170,000 unidades mensuales, se considera razón
suficiente para lanzar una campaña publicitaria que active las ventas de esta
marca. Para conocer la evolución de las ventas, el departamento de marketing
realiza una encuesta a 51 establecimientos autorizados, seleccionados
aleatoriamente, que facilitan la cifra de ventas del último mes en relojes de esta
marca. A partir de estas cifras se obtienen los siguientes resultados: media =
169.411,8 unidades., desviación estándar = 32.827,5 unidades. Suponiendo que
8. las ventas mensuales por establecimiento se distribuyen normalmente; con un
nivel de significación del 5 % y en vista a la situación reflejada en los datos. ¿Se
considerará oportuno lanzar una nueva campaña publicitaria?
Datos:
n = 51
Solución:
H0: (= 170000
H1: (< 170000
a = 0,05
5-Un sociólogo ha pronosticado, que en una determinada ciudad, el
nivel de abstención en las próximas elecciones será del 40% como
mínimo. Se elige al azar una muestra aleatoria de 200 individuos, con
derecho a voto, 75 de los cuales estarían dispuestos a votar.
Determinar con un nivel de significación del 1%, si se puede admitir el
pronóstico.
9. 1. Enunciamos las hipótesis nula y alternativa:
H 0 : μ ≥ 0.40 La abstención será como mínimo del 40%.
H 1 : μ < 0.40 La abstención será como máximo del 40%;
2. Zona de aceptación
Para α = 0.01, le corresponde un valor crítico: z α = 2.33.
Determinamos el intervalo de confianza para la media:
3. Verificación.
4. Decisión
Aceptamos la hipótesis nula H 0 . Podemos afirmar, con un nivel
de significación del 1%, que la La abstención será como mínimo
del 40%.
6-Un informe indica que el precio medio del billete de avión entre
Canarias y Madrid es, como máximo, de 120 € con una desviación
10. típica de 40 €. Se toma una muestra de 100 viajeros y se obtiene
que la media de los precios de sus billetes es de 128 €.
¿Se puede aceptar, con un nivel de significación igual a 0,1, la
afirmación de partida?
1. Enunciamos las hipótesis nula y alternativ a:
H 0 : μ ≤ 120
H 1 : μ > 120
2. Zona de aceptación
Para α = 0.1, le corresponde un valor crítico: z α = 1.28.
Determinamos el intervalo de confianza:
3. Verificación.
Valor obtenido de la media de la muestra: 128 €.
4. Decisión
No aceptamos la hipótesis nula H 0 . Con un nivel de significación
del 10%.
11. 7-Se sabe que la desviación típica de las notas de cierto examen de
Matemáticas es 2,4. Para una muestra de 36 estudiantes se obtuvo
una nota media de 5,6. ¿Sirven estos datos para confirmar la
hipótesis de que la nota media del examen fue de 6, con un nivel de
confianza del 95%?
1. Enunciamos las hipótesis nula y alternativa:
H0: μ = 6 La nota media no ha variado.
H1: μ ≠ 6 La nota media ha variado.
2. Zona de aceptación
Para α = 0.05, le corresponde un valor crítico: z α/2 = 1.96.
Determinamos el intervalo de confianza para la media:
(6-1,96 · 0,4; 6+1,96 · 0,4) = (5,22; 6,78)
3. Verificación.
Valor obtenido de la media de la muestra: 5,6 .
4. Decisión
Aceptamos la hipótesis nula H 0 , con un nivel de significación del 5%.
12. 8-Un gerente de ventas de libros universitarios afirma que en promedio sus
representantes de ventas realiza 40 visitas a profesores por semana. Varios de
estos representantes piensan que realizan un número de visitas promedio superior
a 40. Una muestra tomada al azar durante 8 semanas reveló un promedio de 42
visitas semanales y una desviación estándar de 2 visitas. Utilice un nivel de
confianza del 99% para aclarar esta cuestión.
Datos:
(= 40
n=8
Nivel de confianza del 99%
Nivel de significación = (100%-99%)/2 = 0,5% = 0,005
Solución:
H0: = 40
H1: (> 40
Grados de libertad: n-1 = 8-1 =7
a = 0,005