2. PRUEBAS DE HIPÓTESIS.
Su objetivo es probar o comprobar si la afirmación que se hace sobre un parámetro
poblacional basado en conclusiones obtenidas de tal muestra ya sea correcta o
incorrecta.
HIPÓTESIS ESTADÍSTICO.
Es una suposición o preposición que se basa sobre los parámetros de una
distribución de probabilidad de una variable aleatoria. Dicha hipótesis puede ser
verdadera o falsa.
ERRORES DE TIPO I Y DE TIPO II
El error de tipo I también denominado error de tipo alfa (α)1 o falso positivo, es el error
que se comete cuando el investigador no acepta la hipótesis nula (Ho) siendo ésta
verdadera en la población. Es equivalente a encontrar un resultado falso positivo,
porque el investigador llega a la conclusión de que existe una diferencia entre las
hipótesis cuando en realidad no existe. Se relaciona con el nivel de significancia
estadística.
Representación de los valores posibles de la probabilidad de un error tipo II (rojo) en
el ejemplo de un test de significancia estadística para el parámetro μ. El error tipo II
depende del parámetro μ . Mientras más cerca se encuentre este del valor supuesto
bajo la hipótesis nula, mayor es la probabilidad de ocurrencia del error tipo II. Debido
a que el verdadero valor de μ es desconocido al hacer la presunción de la hipótesis
alternativa, la probabilidad del error tipo II, en contraste con el error tipo I (azul), no se
puede calcular.
Algunos ejemplos para el error tipo I serían:
Se considera que el paciente está enfermo, a pesar de que en realidad está sano;
hipótesis nula: El paciente está sano.
3. No se permite el ingreso de una persona, a pesar de que tiene derecho a ingresar;
hipótesis nula: La persona tiene derecho a ingresar.
ERROR TIPO II.
El error de tipo II, también llamado error de tipo beta (β) (β es la probabilidad de que
exista éste error) o falso negativo, se comete cuando el investigador no rechaza la
hipótesis nula siendo ésta falsa en la población. Es equivalente a la probabilidad de
un resultado falso negativo, ya que el investigador llega a la conclusión de que ha sido
incapaz de encontrar una diferencia que existe en la realidad.
El poder o potencia del estudio representa la probabilidad de observar en la muestra
una determinada diferencia o efecto, si existe en la población. Es el complementario
del error de tipo II (1-β).
PRUEBAS BILATERALES Y PRUEBAS UNILATERALES
Un contraste bilateral adopta en general la forma:
H0: θ = θ0 contra H1: θ ≠ θ0
En determinadas ocasiones el experimentador prefiere plantear directamente un
contraste de la forma:
H0: θ = θ0 contra H1: θ > θ0
Conocido como contraste unilateral derecho. Obviamente, otra posibilidad es el
unilateral izquierdo:
H0: θ = θ0 contra H1: θ < θ0
En estos tres casos, el contraste de hipótesis es simple contra compuesta.
En la mayoría de situaciones aplicadas, se desean realmente resolver contrastes
unilaterales que comportan hipótesis compuestas. El unilateral derecho es entonces:
H0: θ ≤ θ0 contra H1: θ > θ0
Y el izquierdo es:
H0: θ ≥ θ0 contra H1: θ < θ0
Aunque esta última formulación está relacionada con los contrastes unilaterales
simple contra compuesta anteriores, las dos hipótesis no son técnicamente
4. equivalentes Para simplificar la interpretación de los contrastes unilaterales,
atendiendo a los casos de los que se ocupa Statmedia, se formulan los contrastes de
esta última manera (compuesta contra compuesta) y se toma el nivel de significación
como si fuera el del contraste simple contra compuesta.
En cualquier caso, es importante entender que sólo debe resolverse uno de los tres
contrastes (bilateral o unilateral) con un conjunto de datos concreto.
PRUEBA DE UNA HIPOTESIS.
Es el procedimiento para decidir si se acepta o se rechaza por su veracidad o
falsedad, a este tipo de hipótesis también se le conoce como ensayos de
significación.
DISTRIBUCIÓN T DE STUDENT.
En probabilidad y estadística, la distribución t (de Student) es una distribución de
probabilidad que surge del problema de estimar la media de una población
normalmente distribuida cuando el tamaño de la muestra es pequeño.
Aparece de manera natural al realizar la prueba t de Student para la determinación de
las diferencias entre dos medias muéstrales y para la construcción del intervalo de
confianza para la diferencia entre las medias de dos poblaciones cuando se
desconoce la desviación típica de una población y ésta debe ser estimada a partir de
los datos de una muestra.
Distribución t de Student
Función de densidad de probabilidad
La distribución de Student fue descrita en 1908 por William Sealy Gosset. Gosset
trabajaba en una fábrica de cerveza, Guinness, que prohibía a sus empleados la
publicación de artículos científicos debido a una difusión previa de secretos
industriales. De ahí que Gosset publicase sus resultados bajo el seudónimo de
Student.
5. PRUEBAS PAREADAS.
El concepto de prueba pareada se puede extender a comparaciones de más de dos
grupos y hablaremos entonces de bloques de m elementos (tantos elementos por
bloque como grupos o tratamientos), siendo por tanto una pareja un caso particular de
bloque de 2 elementos.
PRUEBAS PAREADAS PARA VARIABLE CUANTITATIVAS.
Si estamos comparando un resultado cuantitativo en dos grupos de datos, a partir de
muestras extraídas de forma aleatoria de una población normal, siendo nA el tamaño
de la primera muestra y nB el de la segunda, la cantidad:
(donde son las medias muéstrales, las correspondientes medias
poblacionales, s la desviación típica muestra conjunta), se distribuye como una t de
Student con nA+nB-2 grados de libertad, proporcionándonos una referencia
probabilística con la que juzgar si el valor observado de diferencia de medias nos
permite mantener la hipótesis planteada, que será habitualmente la hipótesis de
igualdad de las medias (por ejemplo igualdad de efecto de los tratamientos), o lo que
es lo mismo nos permite verificar si es razonable admitir que a la luz de
los datos obtenidos en nuestro experimento.
PRUEBAS PAREADAS PARA VARIABLES CUALITATIVAS.
El concepto de diseño pareado se puede aplicar también al análisis de datos cuyo
resultado es una categoría. Veamos la situación más sencilla, para el caso de que la
variable cualitativa sea dicotómica o binaria, con sólo dos posibles repuestas. Este
planteamiento es habitual en algunos estudios de casos-controles, en los que cada
caso se empareja con un control de acuerdo con un criterio determinado, y en el que
se trata de valorar la frecuencia de la presencia de un factor de riesgo.