Este documento presenta un resumen de las pruebas de hipótesis estadísticas. Explica que una prueba de hipótesis examina una hipótesis nula y una hipótesis alternativa y utiliza un valor p para determinar si se debe rechazar la hipótesis nula. También describe los diferentes tipos de datos, errores tipo I y tipo II, y conceptos clave como estadísticos de prueba y valores críticos.
1. ESCUELA SUPERIOR
POLITÉCNICA DE CHIMBORAZO
Integrantes:
Ariel Ausay
Carlos Guayaulema
Angel Melo
Curso:
Segundo “B”
Tema:
ESTADÍSTICAS: PRUEBAS DE HIPÓTESIS
2. Estadísticas
Pruebas de hipótesis
• Una prueba de hipótesis es una prueba estadística que se utiliza para
determinar si existe suficiente evidencia en una muestra de datos para
inferir que cierta condición es válida para toda la población.
3. CLASIFICACIÓN DE LA PRUEBA DE
HIPÓTESIS
• Una prueba de hipótesis examina dos hipótesis opuestas sobre una población: la
hipótesis nula y la hipótesis alternativa.
• La hipótesis nula es el enunciado que se probará. Por lo general, la hipótesis nula es
un enunciado de que "no hay efecto" o "no hay diferencia".
• La hipótesis alternativa es el enunciado que se desea poder concluir que es
verdadero.
4. PRUEBAS DE UBICACIÓN
• Con base en los datos de la muestra, la prueba determina si se debe rechazar la hipótesis nula.
Para tomar la decisión se utiliza un valor p. Si el valor p es menor que o igual al nivel de
significancia, que es un punto de corte que usted define, entonces puede rechazar la hipótesis
nula.
Un error común de percepción es que las pruebas estadísticas de hipótesis están diseñadas para seleccionar la más
probable de dos hipótesis. En realidad, una prueba mantendrá la validez de la hipótesis nula hasta que haya suficiente
evidencia (datos) en favor de la hipótesis alternativa.
5. Datos que pueden analizarse con una prueba de
hipótesis
• Las pruebas de hipótesis pueden utilizarse para evaluar muchos parámetros
diferentes de una población. Cada prueba está diseñada para evaluar un
parámetro asociado a un determinado tipo de datos. Conocer la diferencia
entre los tipos de datos, y los parámetros que están asociados con cada tipo
de datos, puede ayudarle a elegir la prueba más adecuada
Tendrá datos continuos cuando evalúe la media, la mediana, la desviación estándar o la
varianza.
Cuando usted mide una característica de una parte o proceso, como la longitud, el peso o
la temperatura, por lo general obtiene datos continuos.
Los datos continuos suelen incluir valores fraccionados (o decimales).
Por ejemplo, un ingeniero especializado en calidad desea determinar si el peso medio
difiere del valor indicado en la etiqueta del paquete (500 g).
El ingeniero toma una muestra de cajas de cereal y registra el peso de las cajas.
DATOS CONTINUOS
6. Datos binomiales
Tendrá datos binomiales cuando evalúe una proporción o un porcentaje.
Cuando usted clasifica un elemento, evento o persona en una de dos categorías, obtiene datos binomiales.
Las dos categorías deben ser mutuamente excluyentes, como si/no, pasa/no pasa o defectuoso/no defectuoso.
Por ejemplo, unos ingenieros examinan una muestra de pernos para verificar si existen grietas notables
que no permitan utilizarlos.
Registran el número de pernos inspeccionados y el número de pernos rechazados.
Los ingenieros quieren determinar si el porcentaje de pernos defectuosos es menor que 0.2%.
7. Acerca de las hipótesis nula y alternativa
• Una prueba de hipótesis examina dos hipótesis opuestas sobre una población: la hipótesis
nula y la hipótesis alternativa. La manera en que se configuran estas hipótesis depende de lo
que se intenta demostrar.
• Hipótesis nula (H0)
• La hipótesis nula establece que un parámetro de población es igual a un valor. La hipótesis
nula suele ser una afirmación inicial que los investigadores especifican basándose en
investigaciones previas o en su conocimiento.
• Hipótesis alternativa (H1)
• La hipótesis alternativa establece que el parámetro de población es diferente del valor del
parámetro de población en la hipótesis nula. La hipótesis alternativa es lo que usted podría
pensar que es cierto o espera probar que es cierto.
8. ¿Qué son los errores de tipo I y tipo II?
• Cuando usted realiza una prueba de hipótesis, puede cometer dos tipos de
errores: tipo I y tipo II. Los riesgos de estos dos errores están inversamente
relacionados y son determinados por el nivel de significancia y la potencia de
la prueba. Por lo tanto, usted debe determinar qué error tiene consecuencias
más graves para su situación antes de definir sus riesgos.
• Ninguna prueba de hipótesis es 100% cierta. Puesto que la prueba se basa en
probabilidades, siempre existe la posibilidad de sacar una conclusión
incorrecta.
9. Error de Tipo I
• Si rechaza la hipótesis nula cuando ésta es verdadera, usted comete un error
de tipo I. La probabilidad de cometer un error de tipo I es α, que es el nivel
de significancia que usted establece para su prueba de hipótesis. Un α de 0.05
indica que usted está dispuesto a aceptar una probabilidad de 5% de que está
equivocado cuando rechaza la hipótesis nula. Para reducir este riesgo, debe
utilizar un valor más bajo para α. Sin embargo, si utiliza un valor más bajo
para alfa, significa que tendrá menos probabilidades de detectar una
diferencia verdadera, si es que realmente existe.
10. Error de tipo II
• Cuando la hipótesis nula es falsa y usted no la rechaza, comete un error de
tipo II. La probabilidad de cometer un error de tipo II es β, que depende de
la potencia de la prueba. Puede reducir su riesgo de cometer un error de tipo
II al asegurarse de que la prueba tenga suficiente potencia. Para ello,
asegúrese de que el tamaño de la muestra sea lo suficientemente grande
como para detectar una diferencia práctica cuando ésta realmente exista.
• La probabilidad de rechazar la hipótesis nula cuando es falsa es igual a 1–β.
Este valor es la potencia de la prueba.
11. Comparación de hipótesis direccionales e
hipótesis no direccionales
• Una hipótesis alternativa no direccional establece que la hipótesis nula
está equivocada. Una hipótesis alternativa no direccional no predice si el
parámetro de interés es mayor o menor que el valor de referencia
especificado en la hipótesis nula.
• Una hipótesis alternativa direccional establece que la hipótesis nula está
equivocada y también especifica si el verdadero valor del parámetro es mayor
o menor que el valor de referencia especificado en la hipótesis nula.
• La ventaja de usar una hipótesis direccional es una mayor potencia para
detectar el efecto específico en el que usted está interesado. La desventaja es
que no hay potencia para detectar un efecto en la dirección opuesta.
12. • Un estadístico de prueba es un valor estandarizado que se calcula a partir de
los datos de la muestra durante una prueba de hipótesis. Puede utilizar los
estadísticos de prueba para determinar si puede rechazar la hipótesis nula. El
estadístico de prueba compara sus datos con lo que se espera según la
hipótesis nula. El estadístico de prueba se utiliza para calcular el valor p.
Cuando los datos muestran una clara evidencia en contra de los supuestos de
la hipótesis nula, la magnitud del estadístico de prueba será grande y el valor
p de la prueba puede ser lo suficientemente pequeño como para rechazar la
hipótesis nula.
¿QUÉ ES UN ESTADÍSTICO DE PRUEBA?
13. ¿QUÉ ES UN VALOR CRÍTICO?
• En las pruebas de hipótesis, un valor crítico es un punto en la distribución de
la prueba que se compara con el estadístico de prueba para determinar si
puede rechazarse la hipótesis nula. Si el valor absoluto del estadístico de
prueba es mayor que el valor crítico, usted puede declarar significancia
estadística y rechazar la hipótesis nula. Los valores críticos están asociados
con el nivel de significancia (α), así que sus valores se fijan cuando se elige el
α de la prueba.
14. • Valores críticos en la distribución normal estándar para α = 0.05
• La Figura A muestra que los resultados de una prueba Z de una cola son significativos si
el estadístico de prueba es igual a o mayor que 1.64, el valor crítico en este caso. El área
sombreada representa el 5% (α) del área por debajo de la curva. La Figura B muestra que
los resultados de una prueba Z de dos colas son significativos si el valor absoluto del
estadístico de prueba es igual a o mayor que 1.96, el valor crítico en este caso. Las dos
áreas sombreadas suman el 5% (α) del área por debajo de la curva.