El documento describe los pasos para realizar un contraste de hipótesis, que incluyen enunciar la hipótesis nula y alternativa, elegir un estadístico de contraste, establecer una regla de decisión, calcular el valor del estadístico y el nivel crítico, y adoptar una decisión. También discute posibles errores, la potencia del contraste, el p-valor, y validar las hipótesis de partida como la normalidad.
Introducción:Los objetivos de Desarrollo Sostenible
Contraste de hipótesis: concepto, pasos y errores
1.
2. CONTRASTE DE HIPOTESIS
Es una afirmación respecto a alguna
característica de una
población. Contrastar una hipótesis es
comparar las predicciones con la realidad que
observamos. Si dentro del margen de error
que nos permitimos admitir, hay coincidencia,
aceptaremos la hipótesis y en caso contrario
la rechazaremos.
• La hipótesis emitida se suele designar por Ho y se llama Hipótesis
nula porque parte del supuesto que la diferencias entre el valor
verdadero del parámetro y su valor hipotético es debida al azar, es decir
no hay diferencia.
• La hipótesis contraria se designa por H1 y se llama Hipótesis
alternativa
3. LOS CONTRASTE PUEDEN SER
UNILATERALES O BILATERALES
1. Pueden ser (también llamados de una o dos colas) según
establezcamos las hipótesis, si las definimos en términos de igual y
distinto estamos ante una hipótesis unilateral, si suponemos una
dirección (en términos de mayor o menor) estamos ante uno
unilateral.
Se trata pues, de extraer conclusiones a
partir de una muestra aleatoria y
significativa, que permitan aceptar o
rechazar una hipótesis previamente
emitida, sobre el valor de un parámetro
desconocido de la población. El método
que seguiremos es el siguiente:
1. Enunciar la hipótesis
2. Elegir un nivel de significación a y construir la zona de aceptación
3. Verificar la hipótesis
4. Decidir.
4. POSIBLES ERRORES EN EL CONTRASTE DE
HIPÓTESIS
El contraste de hipótesis no establece la verdad de la hipótesis, sino un
criterio que nos permite decidir si una hipótesis se acepta o se rechaza, o el
determinar si las muestras observadas difieren significativamente de los
resultados esperados. En este proceso podemos incurrir en dos tipos de
errores según sea la situación real y la decisión que tomemos.
Si rechazamos una hipótesis
cuando debiera ser aceptada,
cometemos un error de tipo I,
mientras que si la aceptamos
debiendo ser rechazada diremos
que hemos cometido un error de
tipo II. Minimizar los errores no es
una cuestión sencilla, un tipo suele
ser más grave que otro y los
intentos de disminuir uno suelen
producir el aumento del otro.
5. PASOS EN EL CONTRASTE DE
HIPOTESIS
1. Establecer las hipotesis, Indicando las hipotesis nula (Ho) y la
Hipotesis Alternativa (h1).
2. Especificar los Supuestos que se van asumir, incluyendo los
supuestos distribucionales, de maestreo, de informacion conocida.
3. Elegir un estadistico de contraste apropiado, especificando su
distribucion cuando se asume como verdadera la ‘Ho establecida
en el paso 1 y los supuestos indicados en el paso 2.
4. Establecer una regla de decision, bilateral o unilateral, basada en
el nivel de significacion que se adopte.
5. Calcular, segun la formula indicada, el valor del estadistico de
contraste y el nivel critico.
6. Adoptar la Decision y establecer la conclusion.
6. Los contrastes de hipótesis, como la inferencia estadística en general, son
herramientas de amplio uso en la ciencia en general. En particular, la
moderna Filosofía de la ciencia desarrolla el concepto de falsabilidad de las
teorías científicas basándose en los conceptos de la indiferencia estadística en
general y de los contrastes de hipótesis.
Las técnicas de contraste de hipótesis son también de amplia aplicación en
muchos otros casos, como ensayos clínicos de nuevos medicamentos, control de
calidad, encuestas, etcétera.
7. LA POTENCIA DEL CONTRASTE
En todo el proceso descrito hasta el momento solamente se ha utilizado el
riesgo de tipo I en el desarrollo del contraste. Sabemos que esta asociado
con el riesgo de tipo II de forma que cuando uno aumenta, el otro disminuye.
Tampoco hemos hecho ninguna afirmación acerca de un concepto importante
como es el de potencia del c
ontraste (probabilidad de rechazar la hipótesis nula cuando es falsa).
No es posible calcular la potencia del contraste porque para ello necesitaríamos
un único valor en la hipótesis alternativa (revísese el ejemplo de los cirróticos
utilizado como aplicación de la distribución normal), aunque si podemos realizar
el cálculo para distintos valores en la alternativa (función de potencia) y analizar
lo que ocurre.
8. EL P-VALOR DEL CONTRASTE
Una forma habitual de medir la significación en los
contrastes de hipótesis es el denominado p-valor del
contraste. Su utilización en la investigación aplicada
es debida a que es la forma de presentación de los
resultados de un contraste usada por la mayor parte
de los programas de ordenador.
Se puede definir el p-valor de un contraste como la
probabilidad de obtener un valor neutral más
extremo que el obtenido en nuestro caso particular
(cuando H0 es cierta).
De forma general, el p-valor para el contraste actual se puede calcular
como en una distribución normal estándar.
Para el ejemplo anterior el p-valor es
1-P(-0.217 < Z < 0.217) = 2 P(Z > 0.217) = 0.8285, es decir el p-valor puede
considerarse grande. En la práctica se suele adoptar el criterio de aceptar la
hipótesis cuando el p-valor es mayor que el nivel de significación fijado en el
procedimiento de contraste.
9. VARIANZA DESCONOCIDA
Las aplicaciones prácticas la varianza de la distribución es también
desconocida y ha de ser estimada a partir de los datos. El problema es que
ya no es posible seguir utilizando la distribución normal para el procedimiento
de contraste ya que es necesario eliminar el parámetro s del estadígrafo de
contraste.
De acuerdo con la teoría, además de la distribución muestral de la media
sabemos que sigue una distribución ji-cuadrado con n-1 grados de libertad.
Si suponemos que media y varianza son independientes, es posible combinar
las correspondientes distribuciones muéstrales para obtener una distribución
de Student y eliminar el parámetros.
10. Varianzas desconocidas y distintas:
Supongamos ahora que las varianzas son desconocidas y distintas (s1 ≠ s2) de forma
que ya no es posible eliminar el parámetro en el cálculo de la t de Student. Se han
propuesto diversas aproximaciones para la aproximación de la distribución del
estadígrafo de contraste. Describiremos aquí la aproximación de Welch. La
demostración completa está fuera de los propósitos de este trabajo.
11. CONTRASTES DE COMPARACIÓN DE
MEDIAS PARA MUESTRAS GRANDES
Como ya se comentó para el caso de una única población, el teorema central del
límite permite asignar distribuciones normales a las medias muéstrales aunque la
distribución en la población no sea normal. Si disponemos de una muestra de
tamaño grande y estimamos la varianza poblacional a través de la cuasivarianza
muestral, podemos construir un contraste aproximado de comparación de medias
utilizando la distribución normal.
HIPOTESIS
NIVEL DE SIGNIFICACION: a
REGION DE ACEPTACION:
REGION CRITICA
12. VALIDACIÓN DE LAS HIPÓTESIS DE
PARTIDA
A lo largo de los distintos puntos de la descripción de los contrastes básicos hemos ido
haciendo una serie de suposiciones que no hemos verificado como son las hipótesis de
normalidad o de igualdad de varianzas (homocedasticidad) de las poblaciones. La
validación de estos supuestos se ha dejado para el final aunque debe realizarse
previamente a la aplicación de los procedimientos de contraste.
Existen muchos métodos que permiten la validación de la hipótesis de normalidad,
desde los más formales consistentes en nuevos contrastes cuya hipótesis nula es la
hipótesis de que los datos proceden de una distribución normal, hasta simples
procedimientos descriptivos como el histograma o el Box-Plot que nos permiten decidir si
la distribución es aproximadamente simétrica o normal y si la dispersión de los grupos en
estudio es aproximadamente la misma.