Caso de k muestras. Kruskal Wallis.pptx

CASO DE K MUESTRAS
INDEPENDIENTES

PRUEBA JI-CUADRADO
PROCEDIMIENTO DE LA PRUEBA JI-
CUADRADO
• En primer lugar
• Se seleccionan k muestras independientes mediante un muestreo aleatorio
simple, las cuales deben provenir de k poblaciones independientes.
…
Si el interés se centra en comprobar si existe diferencia significativa entre las proporciones de k poblaciones
independientes, ya no es posible utilizar Z como estadístico de prueba y, en su lugar, se emplea el estadístico ji-
cuadrado desarrollado por Pearson.

Donde Oij es la frecuencia conjunta observada que
corresponde a la i-ésima muestra en la j-ésima categoría.
Es conveniente que el tamaño de cada población sea al
menos 10 veces mayor que el de la muestra; por
ejemplo, si una muestra es de tamaño 40, el tamaño de
la población debe ser 400.
Como se puede notar, las observaciones de cada
muestra se distribuyen en las B1, B2, …, Bc categorías
excluyentes.
Cabe mencionar que es importante observar que, al
tener determinados los tamaños de cada una de las M1,
M2, …, Mk muestras, los totales de las k filas son fijos.
En segundo lugar
Los datos se deben arreglar en una tabla de contingencia de k filas y c
columnas, esto es:

EN TERCER LUGAR
SE CALCULAN LAS FRECUENCIAS ESPERADAS CONJUNTAS MEDIANTE:
Donde:
ni es el tamaño de la i-ésima muestra.
O*j es la suma de las frecuencias observadas en la categoría j.
n es la suma de los tamaños de las k muestras.
Además, se debe tener en cuenta que cada Eij debe ser mayor o igual que
5; en caso contrario, se deben agrupar las categorías.

EN CUARTO LUGAR
SE CALCULA EL ESTADÍSTICO DE PRUEBA MEDIANTE:

DÓCIMA DE HIPÓTESIS DE LA PRUEBA JI-
CUADRADO

RUEBA DE KRUSKAL-WALLIS
PROCEDIMIENTO DE LA PRUEBA DE KRUSKAL-WALLIS
• En primer lugar
• Se consideran k muestras aleatorias independientes de tamaños n1, n2, …, nk, y
• llamaremos n al conjunto total de observaciones, esto es, n = n1 + n2 + …+ nk.

EN SEGUNDO LUGAR
• Se asignan rangos desde 1 hasta n al conjunto de n observaciones como si se tratara de
una sola muestra. Es decir, 1 a la más pequeña, 2 a la segunda más pequeña y así
sucesivamente hasta que a la observación más grande se le asigna el rango n. Si
existieran empates (observaciones con el mismo valor), se les debe asignar el rango
promedio.

EN TERCER LUGAR
• El rango asignado a la i-ésima observación (∀ i = 1, …, n) de la j-ésima muestra
(∀ j =1, …, k) se denomina Rij. A la suma de los rangos asignados a las nj
observaciones de la j-ésima muestra se le denomina nj j i 1 ij R R= = Σ .
Asimismo, el rango promedio de la j-ésima muestra está dado por j j j R = R n .

EN CUARTO LUGAR
• Si la hipótesis nula, que indica que las k poblaciones son idénticas, es verdadera,
los Rj de las k muestras serán parecidos. Por lo tanto, es posible obtener,
tomando como punto de partida la suma de los rangos de cada muestra, un
estadístico capaz de proporcionarnos información sobre el parecido existente
entre las k poblaciones. De esta manera, el estadístico H estará dado por la
siguiente expresión:

DÓCIMA DE HIPÓTESIS DE LA PRUEBA DE KRUSKAL-
WALLIS
i) Hipótesis por plantear
H0 : Las k poblaciones no son distintas.
H0 : La medias son iguales
H1 : Las k poblaciones son distintas.
H1 : Las medias son diferentes
ii) Fijar el nivel de significación
El nivel de significación es la máxima probabilidad de cometer error tipo I, y se denota como α
para 0 ≤ α ≤ 0,10

CASO DE APLICACIÓN DE LA PRUEBA DE KRUSKAL-
WALLIS
Se quiere saber si las ventas semanales promedio de las cuatro agencias de un
minimarket son similares, para lo cual se han registrado los montos (en miles de
dólares) de las ventas de estas cuatro agencias de 10 semanas del año pasado,
seleccionadas aleatoriamente. Los datos se presentan a continuación.

PRUEBA DE LA MEDIANA
PROCEDIMIENTO DE LA PRUEBA DE LA MEDIANA
• En primer lugar
• Se dispone de k muestras independientes de tamaños n1, n2, …, nk, y las k
muestras independientes se ordenan de menor a mayor, obteniéndose a
continuación el valor de la mediana Me de todo el conjunto combinado de n
datos.

EN SEGUNDO LUGAR
• Con base en el valor de la mediana
Me, se construyen dos grupos o
categorías: la categoría 1, formada por
aquellas observaciones que son
superiores a Me, y la categoría 2,
formada por las observaciones que
son iguales o inferiores a Me,
procediéndose al conteo respectivo y a
la construcción de la tabla de
contingencia de las frecuencias
observadas, tal como se muestra a
continuación:

EN TERCER LUGAR
• Se procede al cálculo de las frecuencias
esperadas Eij
• Si la hipótesis nula es verdadera, el estadístico
de prueba tiene una distribución aproximada a
una ji-cuadrado con k-1 grados de libertad.
• Hay que tener en cuenta que en estos casos se
pueden encontrar frecuencias esperadas
menores que 5, donde la aproximación de la
distribución del estadístico de prueba mediante
la ji-cuadrado no es buena, por lo que, a fin de
dar solución al impase, deberán juntarse
muestras o aumentar su tamaño.

Caso de k muestras. Kruskal Wallis.pptx

Recomendados

Recomendados

Más contenido relacionado

Similar a Caso de k muestras. Kruskal Wallis.pptx

Similar a Caso de k muestras. Kruskal Wallis.pptx (20)

Último

Último (20)

Caso de k muestras. Kruskal Wallis.pptx