2. PRUEBA DE HIPÓTESIS
• La prueba de hipótesis comienza con una suposición, denominada
hipótesis, que hacemos en torno a un parámetro de la población.
• Posteriormente se reúnen los datos muéstrales, se calculan las
estadísticos de la muestra y en base a estos valores, con cierto grado de
probabilidad, decidimos que el parámetro supuesto de la población sea
razonablemente el aproximado.
3. PRUEBA DE HIPÓTESIS
• Contraste de hipótesis:
Dentro de la inferencia estadística, un contraste de hipótesis (también
denominado test de hipótesis o prueba de significación) es un
procedimiento para juzgar si una propiedad que se supone cumple una
población estadística es compatible con lo observado en una muestra de
dicha población. Fue iniciada por Ronald Fisher y fundamentada
posteriormente por Jerzy Neyman y Karl Pearson.
4. PRUEBA DE HIPÓTESIS
Está fuertemente asociada a los considerados errores de tipo I y II en
estadística, que definen respectivamente, la posibilidad de tomar un
suceso falso como verdadero, o uno verdadero como falso
Existen diversos métodos para desarrollar dicho test, minimizando los
errores de tipo I y II, y hallando por tanto con una determinada potencia, la
hipótesis con mayor probabilidad de ser correcta.
5. ERRORES DE TIPO I Y II (ALFA Y BETA)
• Una vez realizado el contraste de hipótesis, se habrá optado por una de
las dos hipótesis, y la decisión escogida coincidirá o no con la que en
realidad es cierta. Se pueden dar los cuatro casos que se exponen en el
siguiente cuadro:
6. PRUEBA DE HIPÓTESIS
• Usualmente, se diseñan los contrastes de tal manera que la probabilidad
α sea el 5% (0,05), aunque a veces se usan el 10% (0,1) o 1% (0,01) para
adoptar condiciones más relajadas o más estrictas. El recurso para
aumentar la potencia del contraste, esto es, disminuir β, probabilidad de
error de tipo II, es aumentar el tamaño muestral, lo que en la práctica
conlleva un incremento de los costos del estudio que se quiere realizar.
7. DISTRIBUCIÓN MUESTRAL
• Las muestras aleatorias obtenidas de una población son, por naturaleza
propia, impredecibles. No se esperaría que dos muestras aleatorias del
mismo tamaño y tomadas de la misma población tenga la misma media
muestral o que sean completamente parecidas; puede esperarse que
cualquier estadístico, como la media muestral, calculado a partir de las
medias en una muestra aleatoria, cambie su valor de una muestra a otra,
por ello, se quiere estudiar la distribución de todos los valores posibles
de un estadístico. Tales distribuciones serán muy importantes en el
estudio de la estadística inferencial, porque las inferencias sobre las
poblaciones se harán usando estadísticas muestrales. Como los valores
de un estadístico, tal como Media aritmética, varían de una muestra
aleatoria a otra, se le puede considerar como una variable aleatoria con
su correspondiente distribución de frecuencias. La distribución de
frecuencia de un estadístico muestral se denomina distribución
muestral. En general, la distribución muestral de un estadístico es la de
todos sus valores posibles calculados a partir de muestras del mismo
tamaño.
9. EJEMPLO
• Supondremos una población formada por solo N=3 elementos. Por
ejemplo 3 niños. Se observa la variable X=edad. Consideremos la
selección con reemplazo de todas las muestras posibles de tamaño n=2.
• • Población niños: {A, B, C} Edad: 2, 3 y 4 años respectivamente. • El
espacio muestral formado por todas las muestras posibles • E={AA, AB,
AC, BA, BB, BC, CA, CB, CC}
• Media aritmética=3 años
12. DISTRIBUCIÓN MUESTRAL DE MEDIAS
Media muestral f xf
2 1 2
2,5 2 5
3 3 9
3,5 2 7
4 1 4
Total N=9 27
𝑀 =
x . f
𝑁
𝑀 =
27
9
= 3 𝑎ñ𝑜𝑠
13. TEOREMA CENTRAL DEL LÍMITE
• El teorema central del límite (TCL) es una teoría estadística que establece
que, dada una muestra aleatoria suficientemente grande de la
población, la distribución de las medias muestrales seguirá
una distribución normal.
• Afirma que a medida que el tamaño de la muestra se incrementa,
la media muestral se acercará a la media de la población.
14. ELECCIÓN DE LA PRUEBA ESTADÍSTICA
Para la elección de la prueba estadística se tienen en cuenta los siguientes
factores:
a) La naturaleza de las variables
b) El nivel de medición
c) El número de casos de la muestra
15. PASOS DE LA PRUEBA DE HIPÓTESIS
• 1) Formulación de las hipótesis nula y alternativa.
• 2) Seleccionar el nivel de significacia.
• 3) Elección de la prueba estadística
• 4) Determinación de los puntos críticos
• 5) Observación y cálculo de los resultados muestrales
• 6) Determinación de la zona en que se encuentra el resultado
• 7) Decisión a favor o en contra de la hipótesis de nulidad.
16. DETERMINACIÓN DE LA ZONA EN QUE SE
ENCUENTRA EL RESULTADO
• Se determina si la Media aritmética está en la zona de aceptación o
rechazo.
17. EJEMPLO
1-Los resultados actuales en una prueba de alfabetización en salud
tienden a ser distintos a los generalmente aceptados como típicos en la
población.
2-El promedio de los resultados en la prueba es diferente al
tradicionalmente aceptado (100)
La hipótesis de investigación plantea que la Media de la población es
diferente a 100 y la hipótesis nula dice que la Media va a ser igual a 100.
18. TIPOS DE PRUEBAS
• Prueba bilateral o de dos extremos: la hipótesis planteada se formula con la igualdad. Ejemplo
• H0 : µ = 200
• H1 : µ ≠ 200
19. TIPOS DE PRUEBAS
• Pruebas unilateral o de un extremo: la hipótesis planteada se formula con ≥ o ≤
• H0 : µ ≥ 200 H0 : µ ≤ 200
• H1 : µ < 200 H1 : µ > 200
20. CUANDO CONOCEMOS LOS PARÁMETROS DE LA
POBLACIÓN
• 1-Establecemos la hipótesis de que la media de la muestra pertenece a la población
• 2-Establecemos la hipótesis de nulidad: no hay diferencia entre la media de la muestra
y la media de la población para un nivel de significación del 1 o 5%
• 3-Reducimos la diferencias de la media muestral y la media poblacional a puntajes z
• 4-Buscamos en la tabla de curva normal el valor de z que corresponda al nivel de
significación elegido.
• 5-Comparamos el z del nivel de significación elegido con el z empírico
Si z es >ze no rechazamos la hipótesis de nulidad y decimos que las diferencias
entre la media muestral y poblacional no son significativas
Si z es ≤ ze rechazamos la hipótesis nula y podemos suponer que la media de la
muestra no pertenece a la población
22. DETERMINACIÓN DE LOS PUNTOS
CRÍTICOS
• Determinación de los puntos críticos: equivale a definir las zonas de
aceptación y de rechazo de la hipótesis nula. Se explicíta la regla de la
decisión para inclinarse a rechazar o no rechazar la Ho.
• Si a=0,5 los puntos críticos serán 1,96 y -1,96, en la Curva Normal
23. OBSERVACIÓN Y CÁLCULO DE LOS
RESULTADOS MUESTRALES
• Se calculan los estadísticos de la muestra que
permitirán decidir entre las hipótesis enfrentadas.
Media aritmética, desviación estándar.
• Si la hipótesis y los resultados muestrales se refieren a
medias, se calcula el error estándar de la media.
24. DETERMINACIÓN DE LA ZONA EN QUE SE
ENCUENTRA EL RESULTADO OBSERVADO
• Se determina si la Media está en la zona de aceptación o rechazo.
• Decisión a favor o en contra de la hipótesis nula
• Si cae en la zona de rechazo la decisión alcanzada se anuncia:
“Se rechaza la Ho a un nivel de significación de 0,5" ( cual es el riesgo de
cometer un error de tipo I al tomar la decisión)
“El resultado de la prueba fue significativo al nivel α=0,5
25. PRUEBA DE HIPÓTESIS PARA LA MEDIA
• En las pruebas de hipótesis para la media (μ), cuando se conoce la
desviación estándar (σ) poblacional, o cuando el valor de la muestra es
grande (30 o más), el valor estadístico de prueba es z y se determina a
partir de:
26. EJEMPLO DE CONTRASTE DE HIPÓTESIS PARA
LA MEDIA, CON CONOCIDA (DOS COLAS)
• Se desea contrastar con un nivel de significacion del
5% la hipótesis de que la talla media de los hombres
de 18 o más años de un país es igual a180.
Suponiendo que la desviación estándar de las tallas
en la población vale 4
• H0 : µ= 180
• H1 : µ ≠ 180
• Los datos constituyen una muestra de n=15 hombres
seleccionados al azar, cuyas alturas son:
27. PRUEBA DE LA MEDIA
CUANDO CONOCEMOS LOS PARÁMETROS DE LA
POBLACIÓN
• 1-Establecemos la hipótesis de que la media de la muestra pertenece a
la población
• 2-Establecemos la hipótesis de nulidad: no hay diferencia entre la media
de la muestra y la media de la población para un nivel de significación
del 1 o 5%
• 3-Reducimos la diferencias de la media muestral y la media poblacional
a puntajes z
• 4-Buscamos en la tabla de curva normal el valor de z que corresponda al
nivel de significación elegido.
• 5-Comparamos el z del nivel de significación elegido con el z empírico
Si z es >ze no rechazamos la hipótesis de nulidad y decimos que las
diferencias entre la media muestral y poblacional no son
significativas
28. PRUEBA DE LA MEDIA
CUANDO CONOCEMOS LOS PARÁMETROS
DE LA POBLACIÓN
29. INTERVALO DE CONFIANZA PARA LA
MEDIA DE MUESTRAS GRANDES
Generalmente los parámetros de la población no se conocen, por lo tanto
debemos hacer las inferencias a partir de los datos de la muestra. Como
no tenemos el desvio estándar de la población utilizamos el error estándar
de la distribución muestral
Ejemplo M=20 n=100 s=5 σm=0,5 intervalo de
confianza 95%
30. PRUEBA DE HIPÓTESIS PARA LA MEDIA
• El valor estadístico z, para muestra grande y desviación estándar poblacional desconocida se
determina por la ecuación:
31. DISTRIBUCIÓN T DE STUDENT
- La distribución t surge, en la mayoría de los estudios estadísticos prácticos,
cuando la desviación estándar de una población se desconoce y debe ser
estimada a partir de los datos de la muestra. Se utiliza con muestras
menores a 30 casos.
- Es simétrica y unimodal, con media en 0
- Es una familia de curvas, en función de los llamados “grados de libertad”
(n-1). Es decir, hay una distribución t de Student con 1 gl, una distribución t
de Student con 2 gl, etc., según tamaño de la muestra.
-A medida que aumentan los grados de libertad, la distribución tiende más y
más a una distribución normal estandarizada.
(Empleo: pruebas de contraste de 2 medias, entre otros)
32. PRUEBA DE HIPÓTESIS
• En la prueba para una media poblacional con muestra pequeña y
desviación estándar poblacional desconocida se utiliza el valor
estadístico t.
33.
34. EJEMPLO
• Las puntuaciones en un test que mide la variable creatividad siguen, en la población
general de adolescentes, una distribución Normal de media 11,5 puntos. En un centro
escolar que ha implantado un programa de estimulación de la creatividad en una muestra
de 30 alumnos ha proporcionado las siguientes puntuaciones:
11, 9, 12, 17, 8, 11, 9, 4, 5, 9, 14, 9, 17, 24, 19, 10, 17, 17, 8, 23, 8, 6, 14, 16, 6, 7, 15, 20, 14, 15.
A un nivel de confianza del 95% ¿Puede afirmarse que el programa es efectivo?
1º Ho M = 11,5
2º Ha M > 11,5