2. UNIDAD 4
ESTADÍSTICA NO PARAMÉTRICA.
5.1 Escala de medición
5.2 Métodos estadísticos contra no Paramétricos
5.3 Prueba de corridas para aleatoriedad
5.4 Una muestra: prueba de signos
5.5 Una muestra: prueba de Wilcoxon
5.6 Dos muestras: prueba de Mann-Whitney
5.7 Observaciones pareadas: prueba de signos
5.8Observaciones pareadas prueba de Wilcoxon
5.9Varias muestras independientes: prueba de Krauskal-Wallis
3. INTRODUCCIÒN
La estadística no para métrica es una rama de la estadística que estudia las
pruebas y modelos estadísticos cuya distribución subyacente no se ajusta a los
llamados criterios para métricos.
5.1 ESCALA DE MEDICIÓN
Existen diversas definiciones del término "medición", pero estas dependen de los
diferentes puntos de vista que se puedan tener al abordar el problema de la
cuantificación y el proceso mismo de la construcción de una escala o instrumento
de medición. En general, se entiende por medición la asignación de números a
elementos u objetos para representar o cuantificar una propiedad.
Niveles o Escalas de mediciones
Escala Nominal:
Se trata de agrupar objetos en clases, de modo que todos los que pertenezcan a
la misma sean equivalentes respecto del atributo o propiedad en estudio, después
de lo cual se asignan nombres a tales clases, y el hecho de que a veces, en lugar
de denominaciones, se le atribuyan números, puede ser una de las razones por
las cuales se le conoce como "medidas nominales".
Por ejemplo, podemos estar interesados en clasificar los estudiantes de la
UNESR Núcleo San Carlos de acuerdos a la carrera que cursan.
Carrera Número asignada a la categoría
Educación 1
Administración 2
4. Se ha de tener presente que los números asignados a cada categoría sirven única
y exclusivamente para identificar la categoría y no poseen propiedades
cuantitativas.
Escala Ordinal:
En caso de que puedan detectarse diversos grados de un atributo o propiedad de
un objeto, la medida ordinal es la indicada, puesto que entonces puede recurrirse
a la propiedad de "orden" de los números asignándolo a los objetos en estudio de
modo que, si la cifra asignada al objeto A es mayor que la de B, puede inferirse
que A posee un mayor grado de atributo que B.
La asignación de números a las distintas categorías no puede ser completamente
arbitraria, debe hacerse atendiendo al orden existente entre éstas.
Los caracteres que posee una escala de medida ordinal permiten, por el hecho
mismo de poder ordenar todas sus categorías, el cálculo de las medidas
estadísticas de posición, como por ejemplo la mediana.
Escalas de intervalos iguales:
La escala de intervalos iguales, está caracterizada por una unidad de medida
común y constante que asigna un número igual al número de unidades
equivalentes a la de la magnitud que posea el elemento observado. Es importante
destacar que el punto cero en las escalas de intervalos iguales es arbitrario, y no
refleja en ningún momento ausencia de la magnitud que estamos midiendo. Esta
escala, además de poseer las características de la escala ordinal, encontramos
que la asignación de los números a los elemento es tan precisa que podemos
determinar la magnitud de los intervalos (distancia) entre todos los elementos de la
escala. Sin lugar a dudas, podemos decir que la escala de intervalos es la primera
escala verdaderamente cuantitativa y a los caracteres que posean esta escala de
5. medida pueden calculársele todas las medidas estadísticas a excepción del
coeficiente de variación.
Escala de coeficientes o Razones:
El nivel de medida más elevado es el de cocientes o razones, y se diferencia de
las escalas de intervalos iguales únicamente por poseer un punto cero propio
como origen; es decir que el valor cero de esta escala significa ausencia de la
magnitud que estamos midiendo. Si se observa una carencia total de propiedad,
se dispone de una unidad de medida para el efecto. A iguales diferencias entre los
números asignados corresponden iguales diferencias en el grado de atributo
presente en el objeto de estudio. Además, siendo que cero ya no es arbitrario, sino
un valor absoluto, podemos decir que A. Tiene dos, tres o cuatro veces la
magnitud de la propiedad presente en B.
5.2 MÉTODOS ESTADÍSTICOS CONTRA NO PARAMÉTRICOS
Es una rama de la estadística que estudia las pruebas y modelos estadísticos
cuya distribución subyacente no se ajusta a los llamados criterios paramétricos. Su
distribución no puede ser definida a priori, pues son los datos observados los que
la determinan.
5.3 PRUEBA DE CORRIDAS PARA ALEATORIEDAD
Una corrida es una serie de observaciones similares. La prueba de corridas se usa
para probar la aleatoriedad de una serie de observaciones cuando cada observación
puede ser asignada a una de dos categorías.
Ejemplo. En relación con una muestra aleatoria de n = 10 individuos, supongamos
que cuando se les clasifica por sexo la secuencia de observaciones es: M, M, M, M, F,
F, F, F, M, M. Estos datos contienen tres corridas, o series de elementos semejantes.
6. Respecto de datos numéricos, un medio para obtener el esquema requerido de dos
categorías es clasificar cada observación según si es superior o inferior a la mediana
del grupo. En general, mucho menos corridas o mucho más corridas que las que
serían de esperar al azar resultarían en el rechazo de la hipótesis nula de que la
secuencia de observaciones es una secuencia aleatoria.
El número de corridas de elementos semejantes se determina de acuerdo con los
datos muéstrales, con el uso del símbolo R para designar el número de corridas
observadas. Si n1 equivale al número de elementos muestreados de un tipo y n2 al
número de elementos muestreados del segundo tipo, la media y el error estándar
asociados con la distribución de muestreo de la estadística de prueba R cuando la
secuencia es aleatoria son
Sin, n1 > 20 o n2 > 20, la distribución de muestreo de r aproxima la distribución
normal. Por lo tanto, en estas circunstancias la estadística R puede convertirse a la
estadística de prueba z.
5.4 UNA MUESTRA: PRUEBA DE SIGNOS
La prueba de los signos puede utilizarse para probar una hipótesis nula referente
al valor de la medida de la población. En consecuencia, es el equivalente no
paramétrico a la prueba de una hipótesis referente al valor de la medida de la
población. Es necesario que los valores de la muestra aleatoria se encuentren al
menos en la escala ordinal, aunque no se requiere de supuestos acerca de la
forma de la distribución de la población.
Las hipótesis nula y alternativa pueden aludir ya sea a una prueba bilateral o
unilateral. Si Med denota la mediana de la población y Med0 designa al valor
hipotético, las hipótesis nulas y alternativa para una prueba de dos extremos son:
H0: Med=Med0
H1: Med≠Med0
7. Se aplica un signo de más a cada valor muestra observada mayor que el valor
hipotético de la mediana y un signo de menos a cada valor menor que el valor
hipotético de la mediana. Si un valor maestral es exactamente igual a la mediana
hipotética, no se le aplica ningún signo, con lo que el tamaño de muestra efectivo
se reduce. Si la hipótesis nula sobre el valor de la mediana es cierta, el número de
signos de más debería ser aproximadamente igual al número de signos de menos.
O, para decirlo de otra manera, la proporción de signos de mas debe ser de
alrededor de 0.50. Por consiguiente, la hipótesis nula que se prueba en una
prueba bilaterales H0: π=0.50, donde π es la proporción de la población de los
signos de mas o de menos. Así, una hipótesis referente al valor de la mediana se
prueba en realidad como una hipótesis sobre π. Si la muestra es grande, se puede
hacer uso de la distribución normal.
5.5 UNA MUESTRA: PRUEBA DE WILCOXON
La prueba de Wilcoxon puede usarse para probar una hipótesis nula referente al
valor de la medida de la población. Pero dado que la prueba Wilcoxon considera la
magnitud de la diferencia entre cada valor muestral y el valor hipotético de la
mediana, es una prueba más sensible que la prueba de los signos.
5.6 DOS MUESTRAS: PRUEBA DE MANN-WHITNEY
La prueba de Mann-Whitney se emplea en aquellos casos en los que deseamos
contrastar si existen diferencias entre las poblaciones de donde se extraen dos
muestras, que han de ser aleatorias e independientes. La utilidad de esta prueba
es la misma que la de la prueba t, pero no parte de supuestos y puede ser
aplicada a datos medidos en escala ordinal.
El procedimiento es el siguiente:
1. Hipótesis:
Hipótesis nula: No existen diferencias entre los dos grupos.
Hipótesis alternativa: Hay diferencias entre los dos grupos.
8. 2. Estadístico de contraste:
En este caso, el estadístico a emplear se denomina U de Mann-Whitney, que se
calcula siguiendo estos pasos:
a) Se procede a ordenar las puntuaciones de las dos muestras como si fueran una
sola.
b) A cada una de ellas se le asigna un rango.
c) Se calcula el estadístico T, a partir de la suma de los rangos de la muestra de
menor tamaño.
d) Teniendo T, se calcula U:
Donde U = n1n2 + n1 (n1 + 1)/2 - T
Donde n1 es el número de sujetos de la muestra de menor tamaño, y n 2 el de la
muestra mayor.
3. Como en el caso anterior, el valor observado es comparado con valores
tabulados.
En dicha tabla encontramos la probabilidad asociada a cada valor del estadístico
para una prueba unilateral. Si nuestro contraste es bilateral, sólo tendremos que
multiplicar por dos el valor tabular correspondiente a una cola.
5.7 OBSERVACIONES PAREADAS: PRUEBA DE SIGNOS
También se puede utilizar la prueba de signo para probar la hipótesis nula
para observaciones pareadas. Aquí se reemplaza cada
diferencia, di, con un signo más o menos dependiendo si la diferencia ajustada, d i-
d0, es positiva o negativa. A lo largo de esta sección suponemos que las
poblaciones son simétricas. Sin embargo, aun si las poblaciones son asimétricas
se puede llevar a cabo el mismo procedimiento de prueba, pero las hipótesis se
refieren a las medianas poblacionales en lugar de las medias.
9. 5.8 OBSERVACIONES PAREADAS PRUEBA DE WILCOXON
PRUEBA DE RANGO CON SIGNO DE WILCOXON
Se puede notar que la prueba de signo utiliza sólo los signos más y menos de las
diferencias entre las observaciones y 0 en el caso de una muestra, o los signos
más y menos de las diferencias entre los pares de observaciones en el caso de la
muestra pareada, pero no toma en consideración la magnitud de estas diferencias.
Una prueba que utiliza dirección y magnitud, propuesta en 1945 por Frank
Wilcoxon, se llama ahora comúnmente prueba de rango con signo de Wilcoxon.
Esta prueba se aplica en el caso de una distribución continua simétrica. Bajo esta
condición se puede probar la hipótesis nula 0. Primero se resta de cada
valor muestral y se descarta todas las diferencias iguales a cero. Se asigna un
rango de 1 a la diferencia absoluta más pequeña, un rango de 2 a la siguiente más
pequeña, y así sucesivamente. Cuando el valor absoluto de dos o más diferencias
es el mismo, se asigna a cada uno el promedio de los rangos que se asignarían si
las diferencias se distinguieran. Por ejemplo, si la quinta y sexta diferencia son
iguales en valor absoluto, a cada una se le asignaría un rango de 5.5. Si la
hipótesis 0 es verdadera, el total de los rangos que corresponden a las
diferencias positivas debe ser casi igual al total de los rangos que corresponden a
las diferencias negativas. Se representan esos totales como w+ y w-,
respectivamente. Se designa el menor de w+ y w- con w.
Al seleccionar muestras repetidas esperaríamos que variaran w+ y w-, y por tanto
w. De esta manera se puede considerar a w+ y w-, y w como valores de las
correspondientes variables aleatorias W +, W-, y W. La hipótesis nula 0 se
puede rechazar a favor de la alternativa 0 sólo si w+ es pequeña y w- es
grande. Del mismo modo, la alternativa 0 se puede aceptar sólo si w+ es
grande y w- es pequeña. Para una alternativa bilateral se puede rechazar H 0 a
favor de H1 si w+ o w- y por tanto w son suficientemente pequeñas. No importa
10. cuál hipótesis alternativa puede ser, rechazar la hipótesis nula cuando el valor de
la estadística apropiada W +, W -, o W es suficientemente pequeño.
5.9 VARIAS MUESTRAS INDEPENDIENTES: PRUEBA DE
KRAUSKAL-WALLIS
Esta prueba estadística de análisis de varianza de entrada simple de Kruskal-
Wallis es una extensión de la prueba de U Mann-Whitney, en razón de que se
usan rangos para su aplicación; por otra parte, este procedimiento se emplea
cuando el modelo experimental contiene más de dos muestras independientes.
Dicha prueba se define matemáticamente de la forma siguiente:
Donde:
H = valor estadístico de la prueba de
Kruskal-Wallis.
N = tamaño total de la muestra.
Rc2 = sumatoria de los rangos elevados
al cuadrado.
ni = tamaño de la muestra de cada
grupo.
L = ajuste dado por el ajuste de ligas o
empates de los rangos.
11. El ajuste L se calcula de la manera siguiente:
Donde:
Li = valor de número de empates de un rango.
N = tamaño total de la muestra.
Se utiliza cuando:
Cuando son diferentes tratamientos o condiciones.
Muestras pequeñas.
Se utiliza escala ordinal.
Si las muestras se seleccionaron de las diferentes poblaciones.
Contrastar hipótesis (direccional o no direccional).
Pasos:
1. Ordenar las observaciones en rangos de todos los grupos, del más pequeño
al mayor.
2. Asignar el rango para cada observación en función de cada grupo de
contraste, elabora la sumatoria de rangos, elevar al cuadrado este valor y
dividirlo entre el número de elementos que contiene (ni).
3. Detectar las ligas o empates entre los rangos de cada grupo y aplicar la
ecuación (L) para obtener el ajuste.
4. Aplicar la ecuación de Kruskal-Wallis y obtener el estadístico H.
5. Calcular los rangos de libertad (gl): gl = K grupos - 1.
6. Comparar el estadístico H, de acuerdo con los grados de libertad, en la tabla
de distribución de ji cuadrada en razón de distribuirse de forma similar.
7. Decidir si se acepta o rechaza la hipótesis.