Este documento describe los conceptos y procedimientos básicos de las pruebas de hipótesis. Explica que una prueba de hipótesis involucra plantear una hipótesis nula y una hipótesis alternativa, establecer un nivel de significación, aplicar un estadístico de prueba y establecer una regla de decisión para aceptar o rechazar la hipótesis nula. También describe cómo se calculan los intervalos de confianza y cómo estos permiten estimar parámetros poblacionales a partir de datos mue
1. 1
1 1
Prueba, test o contraste de hipótesis es
una técnica estadística que se sigue para decidir si
rechazamos o no una hipótesis estadística en base a la
información de una muestra.
El propósito de la prueba o de hipótesis es ayudar al
investigador a tomar decisiones referentes a una población
considerando la información de una muestra de dicha
población.
Estadísticamente una prueba de hipótesis es cualquier
afirmación acerca de una población y/o sus parámetros.
Una prueba de hipótesis consiste en contrastar dos
hipótesis estadísticas. Tal contraste involucra la toma de
decisión acerca de las hipótesis. La decisión consiste en
rechazar o no una hipótesis en favor de la otra. Una
hipótesis estadística se denota por “H” y son dos:
- Ho: hipótesis nula
PRUEBA DE HIPÓTESIS.
INTERVALOS DE CONFIANZA
1
2. Pasos para la prueba de hipótesis
Plantear las hipótesis
Ho:μ1-μ2=0
H1:μ1-μ2≠0
Establecer el nivel de significación α = 0.05
-Aplicar el estadístico de prueba, previo comprobación de
supuestos como la distribución de la población, igualdad
de varianzas, etc.
-Establecer regla de decisión
-Sacar la conclusión
miércoles, 18 de abril de 2012 2
3. Para este fin se plantea:
Una hipótesis Nula (H 0 ): Formulada con el único propósito
de rechazarla o invalidarla, de la no diferencia, del no
cambio, de que no es bueno, de la no asociación
(independencia), etc.
Una hipótesis alternativa (H 1 ): Es la hipótesis que difiere de
la hipótesis nula, si H 0 plantea =, H 1 planteará >, <, ò ≠
Plantear hipótesis
miércoles, 18 de abril de 2012 3
4. METODOLOGÍA
La lógica de una prueba de hipótesis es similar a la de un juicio
penal, donde debe decidirse si el acusado es inocente o culpable
y el juicio consiste en aportar evidencia para rechazar la
hipótesis de inocencia más allá de cualquier duda razonable.
Por su parte una prueba de hipótesis analiza si los datos
observados permitan rechazar la hipótesis nula, comprobando si
éstos tienen una probabilidad de aparecer lo suficientemente
pequeña cuando es cierta la hipótesis nula.
miércoles, 18 de abril de 2012 4
5. Región de Rechazo:
Una vez fijado a , la región de rechazo se determina a partir
de la distribución de probabilidad de d(m , x) cuando Ho es
cierta. Como esta distribución es conocida elegiremos d de
manera que discrepancias mayores de c d tengan probabilidad
de ocurrir menor de a ,si Ho es cierta. La región de rechazo
será c d > d y la de no rechazo será por consiguiente: c d £ d.
Tipos de errores:
Cuando se decide sobre el rechazo de una hipótesis se
pueden cometer dos Error tipo l se presenta si la hipótesis nula
Ho es rechazada cuando es verdadera y debía ser aceptada. La
probabilidad de cometer un error tipo I se denomina con la
letra alfa αUn error tipo II, se denota con la letra griega βse
presenta si la hipótesis nula es aceptada cuando de hecho es
falsa y debía ser rechazada. Existe un equilibrio entre los dos
tipos de errores, la probabilidad de cometer un tipo de error
puede reducirse sólo si deseamos incrementar la probabilidad
de cometer el otro.
miércoles, 18 de abril de 2012 5
6. 1) Una empresa está interesada en lanzar un nuevo producto al mercado.
Tras realizar una campaña publicitaria, se toma la muestra de 1000
habitantes, de los cuales, 25 no conocían el producto. A un nivel de
significación del 1% ¿apoya el estudio las siguientes hipótesis?
a. Más del 3% de la población no conoce el nuevo producto.
b. Menos del 2% de la población no conoce el nuevo producto
Datos:
n = 1000
x = 25
Donde:
x = ocurrencias
n = observaciones
= proporción de la muestra
= proporción propuesta
Solución:
a)
a = 0,01
miércoles, 18 de abril de 2012 6
7. 2- Un gerente de ventas de libros universitarios afirma que en
promedio sus representantes de ventas realiza 40 visitas a
profesores por semana. Varios de estos representantes
piensan que realizan un número de visitas promedio superior a
40. Una muestra tomada al azar durante 8 semanas reveló un
promedio de 42 visitas semanales y una desviación estándar
de 2 visitas. Utilice un nivel de confianza del 99% para aclarar
esta cuestión.
Datos:
(= 40
n=8
Nivel de confianza del 99%
Nivel de significación = (100%-99%)/2 = 0,5% = 0,005
Solución:
H0: (= 40
H1: (> 40
Grados de libertad: n-1 = 8-1 =7
a = 0,005
miércoles, 18 de abril de 2012 7
8. 3-Un investigador de mercados y hábitos de comportamiento
afirma que el tiempo que los niños de tres a cinco años
dedican a ver la televisión cada semana se distribuye
normalmente con una media de 22 horas y desviación estándar
6 horas. Frente a este estudio, una empresa de investigación
de mercados cree que la media es mayor y para probar su
hipótesis toma una muestra de 64 observaciones procedentes
de la misma población, obteniendo como resultado una media
de 25. Si se utiliza un nivel de significación del 5%. Verifique si
la afirmación del investigador es realmente cierta.
Datos:
n = 64
a = 5% = 0,05
Solución:
H0: (= 22
H1: (> 22
a = 0,05
miércoles, 18 de abril de 2012 8
9. 4-Cuando las ventas medias, por establecimiento autorizado,
de una marca de relojes caen por debajo de las 170,000
unidades mensuales, se considera razón suficiente para lanzar
una campaña publicitaria que active las ventas de esta marca.
Para conocer la evolución de las ventas, el departamento de
marketing realiza una encuesta a 51 establecimientos
autorizados, seleccionados aleatoriamente, que facilitan la cifra
de ventas del último mes en relojes de esta marca. A partir de
estas cifras se obtienen los siguientes resultados: media =
169.411,8 unidades., desviación estándar = 32.827,5 unidades.
Suponiendo que las ventas mensuales por establecimiento se
distribuyen normalmente; con un nivel de significación del 5 %
y en vista a la situación reflejada en los datos. ¿Se considerará
oportuno lanzar una nueva campaña publicitaria?
Datos:
n = 51
Solución:
H0: (= 170000
H1: (< 170000
a = 0,05
miércoles, 18 de abril de 2012 9
10. 5-Un gerente de ventas de libros universitarios afirma que en
promedio sus representantes de ventas realiza 40 visitas a
profesores por semana. Varios de estos representantes
piensan que realizan un número de visitas promedio superior a
40. Una muestra tomada al azar durante 8 semanas reveló un
promedio de 42 visitas semanales y una desviación estándar
de 2 visitas. Utilice un nivel de confianza del 99% para aclarar
esta cuestión.
Datos:
(= 40
n=8
Nivel de confianza del 99%
Nivel de significación = (100%-99%)/2 = 0,5% = 0,005
Solución:
H0: = 40
H1: (> 40
Grados de libertad: n-1 = 8-1 =7
a = 0,005
miércoles, 18 de abril de 2012 10
11. Un informe indica que el precio medio del billete de
avión entre Canarias y Madrid es, como máximo, de
120 € con una desviación típica de 40 €. Se toma una
muestra de 100 viajeros y se obtiene que la media de
los precios de sus billetes es de 128 €.
¿Se puede aceptar, con un nivel de significación
igual a 0,1, la afirmación de partida?
1. Enunciamos las hipótesis nula y alternativa:
H 0 : μ ≤ 120
H 1 : μ > 120
2. Zona de aceptación
Para α = 0.1, le corresponde un valor crítico: z α =
1.28.
Determinamos el intervalo de confianza:
3. Verificación.
Valor obtenido de la media de la muestra: 128 €.
4. Decisión
No aceptamos la hipótesis nula
miércoles, 18 de abril de 2012 11
12. Se sabe que la desviación típica de las notas de cierto
examen de Matemáticas es 2,4. Para una muestra de 36
estudiantes se obtuvo una nota media de 5,6. ¿Sirven
estos datos para confirmar la hipótesis de que la nota
media del examen fue de 6, con un nivel de confianza
del 95%?
1. Enunciamos las hipótesis nula y alternativa:
H0 : μ = 6 La nota media no ha variado.
H1 : μ ≠ 6 La nota media ha variado.
2. Zona de aceptación
Para α = 0.05, le corresponde un valor crítico: z α/2 =
1.96.
Determinamos el intervalo de confianza para la media:
(6-1,96 · 0,4; 6+1,96 · 0,4) = (5,22; 6,78)
3. Verificación.
Valor obtenido de la media de la muestra: 5,6 .
4. Decisión
Aceptamos la hipótesis nula H 0 , con un nivel de
significación del 5%.
miércoles, 18 de abril de 2012 12
13. Un gerente de ventas de libros universitarios afirma que en
promedio sus representantes de ventas realiza 40 visitas a
profesores por semana. Varios de estos representantes
piensan que realizan un número de visitas promedio superior a
40. Una muestra tomada al azar durante 8 semanas reveló un
promedio de 42 visitas semanales y una desviación estándar
de 2 visitas. Utilice un nivel de confianza del 99% para aclarar
esta cuestión.
Datos:
(= 40
n=8
Nivel de confianza del 99%
Nivel de significación = (100%-99%)/2 = 0,5% = 0,005
Solución:
H0: = 40
H1: (> 40
Grados de libertad: n-1 = 8-1 =7
a = 0,005
miércoles, 18 de abril de 2012 13
14. INTERVALOS DE CONFIANZA
Estimación puntual y por intervalo
Las medias o desviaciones estándar calculadas de una
muestra se denominan ESTADÍSTICOS, podrían ser
consideradas como un punto estimado de la media y
desviación estándar real de población o de los
PARÁMETROS.
ESTIMADOR PUNTUAL: Utiliza un número único o valor para
localizar una estimación del parámetro.
ESTIMADOR POR INTERVALO DE CONFIANZA: Denota un
rango dentro del cual se puede encontrar el parámetro y el
nivel de confianza que el intervalo contiene al parámetro.
LIMITES DE CONFIANZA: Son los límites del intervalo de
confianza inferior (LIC) y superior (LSC), se determinan
sumando y restando a la media de la muestra un cierto número
Z (dependiendo del nivel o coeficiente de confianza) de errores
estándar de la media .
miércoles, 18 de abril de 2012 14
17. 3- Los tiempos de reacción, en mili segundos, de 17 sujetos
frente a una matriz de 15
estímulos fueron los siguientes: 448, 460, 514, 488, 592, 490,
507, 513, 492, 534,
523, 452, 464, 562, 584, 507, 461
Suponiendo que el tiempo de reacción se distribuye
Normalmente, determine un intervalo de
Confianza para la media a un nivel de confianza del 95%.
Solución:
Mediante los cálculos básicos obtenemos que la media
muestral vale 505,35 y la desviación
Típica 42,54. 2- En una muestra de 65 sujetos las puntuaciones
en una escala de extroversión tienen una
media de 32,7 puntos y una desviación típica de 12,64.
a) Calcule a partir de estos datos el correspondiente intervalo
de confianza, a un nivel del
90%, para la media de la población.
b) Indique, con un nivel de confianza del 95%, cual sería el
máximo error que podríamos
Cometer al tomar como media de la población el valor obtenido
en la estimación puntual.
Solución:
a) Buscando en las tablas de la t de Student obtenemos que el
valor que deja por debajo una
Probabilidad del 95% es 1,671 (aproximadamente).
Sustituyendo los valores de esta muestra
en la expresión del intervalo de confianza obtenemos:
( 32,7 - 1,671 · 12,64 / 8 ,, 32,7 + 1,671 · 12,64 / 8 )
miércoles, 18 de abril de 2012 17
18. Operando
( 30,06 ,, 35,34 )
b) En las tablas de la t de Student encontramos que el valor de
la variable que deja por
debajo una probabilidad de 0,975 es 2. En consecuencia a un
nivel de confianza del 95% la
media de la población puede valer
32,7 ± 2 · 12,64 / 8
luego el máximo error que se puede cometer, a este nivel de
confianza, es: 3,16
Buscando en las tablas de la t de Student con 16 grados de
libertad, obtenemos que el valor
que deja por debajo una probabilidad de 0,975 es 2,12
Sustituyendo estos valores en la expresión del intervalo de
confianza de la media tenemos:
(505,35 - 2,12 · 42,54 / 4 , , 505,35 + 2,12 · 42,54 / 4)
Operando
( 482,80 , , 527,90 )
miércoles, 18 de abril de 2012 18
19. 4- En una muestra de 65 sujetos las puntuaciones en una
escala de extroversión tienen una
Media de 32,7 puntos y una desviación típica de 12,64.
a) Calcule a partir de estos datos el correspondiente intervalo
de confianza, a un nivel del
90%, para la media de la población.
b) Indique, con un nivel de confianza del 95%, cual sería el
máximo error que podríamos
Cometer al tomar como media de la población el valor obtenido
en la estimación puntual.
Solución:
a) Buscando en las tablas de la t de Student obtenemos que el
valor que deja por debajo una
Probabilidad del 95% es 1,671 (aproximadamente).
Sustituyendo los valores de esta muestra
en la expresión del intervalo de confianza obtenemos:
( 32,7 - 1,671 · 12,64 / 8 ,, 32,7 + 1,671 · 12,64 / 8 )
Operando
( 30,06 ,, 35,34 )
b) En las tablas de la t de Student encontramos que el valor de
la variable que deja por
Debajo una probabilidad de 0,975 es 2. En consecuencia a un
nivel de confianza del 95% la
Media de la población puede valer
32,7 ± 2 · 12,64 / 8
Luego el máximo error que se puede cometer, a este nivel de
confianza, es: 3,16
miércoles, 18 de abril de 2012 19
20. 5- En una muestra de 300 universitarios el 80% ha respondido
que asiste semanalmente al
cine. Entre que valores se encuentra, con un nivel de confianza
del 95%, la proporción de
Universitarios que acude todas las semanas al cine.
Solución:
En las tablas de la Normal encontramos que el valor de la
variable que deja por debajo una
Probabilidad de 0,975 es 1,96.
Sustituyendo en la expresión del intervalo de confianza para
una proporción:
Operando
( 0,755 ,, 0,845 )
miércoles, 18 de abril de 2012 20
21. 6-Un nadador obtiene los siguientes tiempos, en minutos, en 10
pruebas cronometradas por su
Entrenador: 41,48 42,34 41,95 41,86 41,60 42,04 41,81
42,18 41,72 42,26.
Obtener un intervalo de confianza para la marca promedio de
esta prueba con un 95% de
Confianza, suponiendo que se conoce por otras pruebas que la
desviación típica para este
Nadador es de 0,3 minutos. Si el entrenador quiere obtener un
error en la estimación de la
Media de este nadador inferior a tres segundos, ¿cuántas
pruebas debería cronometrar?
SOLUCIÓN:
Para dar un intervalo de confianza de la media conocida la
desviación típica, utilizamos es
Estadístico pivote:
y para 1 α = 0,95 el intervalo de confianza es:
¿Quién es en nuestro caso Es un
valor tal que en la tabla de la normal, sabemos que
Dado
el espacio muestral sustituyendo se obtiene el intervalo:
(41,924 – 0, 186 , 41,924 + 0,186). El valor 0,186 se llama margen
de error.
El intervalo para la media es ( 41 , 738 , 42, 11)
Esto es lo mismo que decir que la media es 41,924 ± 18,6 %. Es
decir que la media se estima en
41,92 con un margen de error de ± 18,6 %
miércoles, 18 de abril de 2012 21
22. 7-En una encuesta a 360 alumnos de un centro, elegidos al
azar, resultaron 190 a favor de la
política del actual equipo directivo. ¿Cuál es el intervalo de
confianza, con nivel del 95%, para
la proporción de alumnos que apoyan a esta dirección?
SOLUCIÓN:
Hay que averiguar un intervalo de confianza para estimar una
proporción, donde resulta que el
valor del parámetro en la muestra elegida es
=190/360=0,5278.
Para obtener un intervalo de confianza de una proporción, el
pivote estadístico es:
la proporción
muestral y p la proporción
Poblacional. De este modo resulta el intervalo de confianza
para un nivel de confianza 1-α el
Siguiente: ) En nuestro
caso 1-α = 0,95 y α/2=0,025
Vamos a la tabla de la normal y calculamos cuyo valor es
1,96 de modo que el intervalo de confianza pedido es:
dicho en otros términos, la proporción de alumnos que apoyan
a la junta directiva es del
orden del 52,7% con un margen de error de ±5,15%
miércoles, 18 de abril de 2012 22