Este documento presenta la prueba de suma de rangos de Wilcoxon, una prueba no paramétrica para comparar el rango medio de dos muestras relacionadas. Explica que la prueba consiste en sumar los rangos de signo frecuente sin una fórmula específica. Luego aplica la prueba a un ejemplo de datos de contenido de nicotina en cigarrillos para determinar si las medianas son iguales o diferentes entre dos marcas. El resultado es que no se rechaza la hipótesis nula de que las medianas son
presentación del tema FIEBRE Y NEUTROPENIA ONCOLOGIA.pptx
Trabajo de estadistica 2 prueba de suma de rango.pptx
1. Universidad Nacional de Ingeniería
Instituto de Estudios Superiores
Facultad de Sistemas
Tema: Prueba de suma de rango de Wicoxon.
Trabajo de Estadística II
Leiker Fabian López Castillo.
Pedro Pablo Chávez Colindres.
Jeremy Boanerges Calderón.
Sergio Alfonso Gordillo Moreno.
Integrantes:
Profesora: Ana Gabriela Moreno Ulloa.
Grupo: 2m2 s
Fecha: Viernes 22 de Octubre del 2021.
Carrera: Ingeniería en Sistemas.
2. Prueba de suma de rangos de Wicoxon.
Concepto
La prueba de los rangos es una Prueba no paramétrica para comparar el rango medio de dos muestras
relacionadas y determinar si existen diferencias entre ellas.
Dicha prueba estadística consiste en sumar los rangos de signo frecuente; por ello, no se tiene una
ecuación o fórmula, como se observa en otras pruebas estadísticas.
Características
1) Esta prueba se emplea en dos muestras independientes. Es análoga a la prueba paramétrica
t para dos muestras independientes.
2) La variable debe de estar en escala cuantitativa o al menos en escala ordinal.
3) Esta prueba es más potente que la de la Median ya que utiliza la información relativa a la
ubicación de cada observación en las muestras
3. Ventajas
A) Suelen ser más económicos que los procedimientos clásicos, porque el que está
llevando a cabo su aplicación logra aumentar la potencia de respuesta al ahorrar
tiempo, dinero y trabajo, cuando selecciona muestras más grandes de datos que se
miden con más exactitud, es decir, datos cualitativos o datos en forma de rango para
obtener una solución más rápida de los problemas.
B) Suelen ser fáciles de aplicar y rápidos para operar cuando los tamaños de las
muestras son pequeñas, lo cual casi siempre ocurre. A menudo, se usan, para pruebas
piloto, estudios preliminares en situaciones donde hay necesidad de respuestas casi
inmediatas.
C) Permiten la solución de problemas que no implican la prueba de los parámetros.
D) Es posible utilizarlas con tipos de datos cualitativos como son: de escala nominal, de
escala ordinal y de escala de intervalo o de proporción. Los de escala nominal son
aquellos que, como su nombre lo indica, son nombres o categorías, los posibles valores
de la variable. Los datos de escala ordinal son los que se localizan o abarcan una forma
de orden creciente o decreciente, o un rango. Los datos de escala de intervalo o
proporción son esos que se han medido con más precisión.
E) Tienen menos suposiciones y no son tan estrictas, ya que se satisfacen con más
facilidad que los procedimientos paramétricos o clásicos.
4. F) Gozan de mayor aplicabilidad, puesto que dan por resultado un grupo de
conclusiones más generales bajo una base más amplia.
G) Llegan a ser casi tan potentes, según el procedimiento particular
seleccionado, como los procedimientos paramétricos, cuando se satisfacen las
suposiciones de estos últimos y ser más eficientes, cuando no se cumplen los
supuestos del procedimiento clásico o paramétrico.
Se debe remarcar que los métodos o procedimientos no paramétricos se llegan a
emplear con ventaja en variedad de situaciones.
5. Desventajas
A) Conforme aumenta el tamaño de la muestra, la operatividad de datos requerida
para los procedimientos no paramétricos suele ser laboriosas, salvo que estén
disponibles programas en paquetes computacionales, para la solución de dichos
problemas específicos.
B) Resulta desventajoso utilizar los procedimientos no paramétricos cuando se
satisfacen todas las suposiciones de los procedimientos paramétricos y los datos
se miden en una escala de intervalo o de proporción, salvo que se usen métodos
paramétricos en tales casos. El que maneja métodos no paramétricos no aprovecha
al máximo los datos, ya que se pierde la información cuando se convierten los datos
recopilados de una escala de intervalo o de proporción a una escala ordinal o a una
escala nominal. En particular, en esas circunstancias, hay algunas pruebas no
paramétricas muy rápidas y sencillas, que tienen mucha menos potencia que los
métodos paramétricos y, por lo tanto, se deben evitar en lo posible.
6. C) Hay varios tipos de problemas estadísticos para los cuales
todavía no se han desarrollado procedimientos no paramétricos.
En conclusión, la principal ventaja de las pruebas no
paramétricas consiste en que llegan a realizarse inferencias
exactas cuando las suposiciones fundamentales de los métodos
estándar no se cumplen en su totalidad; su principal desventaja
radica en que exigen menos cuando todas las suposiciones se
satisfacen.
7. Ejercicio Aplicado de la Prueba de suma de rangos
Se encontró que el contenido de nicotina de dos Marcas de cigarrillos (delmont y casino)
Medido en miligramos es la siguiente:
Marca A (Delmont) Marca B(Casino)
2.1
4.0
6.3
5.4
4.8
3.7
6.1
3.3
4.1
0.6
3.1
2.5
4.0
6.2
1.6
2.2
1.9
5.4
A un nivel de significancia de 0.05 pruebe la hipótesis de que las medianas del contenido de nicotina
de las dos marcas(delmont y casino) son iguales en comparación con la hipótesis alternativa que son
diferentes
8. Marca A(Delmont) Rango Marca B (Casino) Rango
2.1 4 4 4.1 12 12
4.0 10 10.5 0.6 1 1
6.3 18 18 3.1 7 7
5.4 14 14.5 2.5 6 6
4.8 13 13 4.0 11 10.5
3.7 9 9 6.2 17 17
6.1 16 16 1.6 2 2
3.3 8 8 2.2 5 5
1.9 3 3
5.4 15 14.5
n1 = 8 W1 = 93 n2 = 10 w2 = 78
Planteamiento de la hipótesis
Ho : MA = MB
H1: MA≠ MB Significa dos colas
∝ = 0.05
1. Calculo de la suma y rango
Significa una cola
9. Datos originales Rango Datos originales Rango
0.6
1.6
1.9
2.1
2.2
2.5
3.1
3.3
3.7
1
2
3
4
5
6
7
8
9
4.0
4.0
4.1
4.8
5.4
5.4
6.1
6.2
6.3
10.5
10.5
12
13
14.5
14.5
16
17
18
Datos ordenados de la tabla anterior:
10. 1. Calculo de la suma de elementos y cálculos de los Rangos.
Paso 1
Primero sumamos los elementos cada una de las columnas en este caso la suma será representada
Como n1 y n2 en el cual en el n1 nos da = 8 y en el n2 = 10 representado con la flecha
Naranja
Paso 2
Sacar los rangos de todos los datos . Los rangos los podemos sacar empezando desde el mas
pequeño hasta el mas grande y los rangos que sean iguales los sacamos y los sumamos y lo
dividimos entre 2 que son las colas marca A y Marca B y el resultado que nos den ambos ese será
el resultado de los dos en el rango según lo muestra la flecha verde
4.0 4.0
10 + 11 = 21 / 2 = 10.5
5.4 5.4
14 + 15 = 29 / 2 = 14.5
11. 2. Calculo de las U
Paso 1
suma el valor de cada una de las columnas donde calculamos los rangos de
cada uno de los elementos el cual lo representaremos con una w tal como lo
Muestra la flecha celeste
Paso 2
Sustituir los valores obtenidos en la suma de los elementos y calculo de los
rangos.
𝒖𝟏 = 𝒘𝟏 −
𝑛1 𝑛1 + 1
2
𝒖𝟏 = 𝟗𝟑 − 𝟑𝟔
𝑢1 = 57
𝒖𝟏 = 𝟗𝟑 −
𝟖 𝟖 + 1
2
𝒖𝟏 = 𝟗𝟑 −
𝟖 𝟗
2
𝒖𝟏 = 𝟗𝟑 −
𝟕𝟐
2
12. 𝒖𝟐 = 𝒘𝟐 −
𝑛𝟐 𝑛𝟐 + 1
2
𝒖𝟐 = 𝟕𝟖 − 𝟓𝟓
𝑢𝟐 = 𝟐𝟑
𝒖𝟐 = 𝟕𝟖 −
𝟏𝟎 𝟏𝟎 + 1
2
𝒖𝟐 = 𝟕𝟖 −
𝟏𝟎 𝟏𝟏
2
𝒖𝟐 = 𝟕𝟖 −
𝟏𝟏𝟎
2
Paso 3
Encontrar la U calculada y la U calculada no es mas que el valor mas pequeño que hemos encontrado en
las formulas de U en este seria es 23 y las intersección que la encontraremos en la siguiente tabla que
mostraremos a continuación
𝑼𝒄𝒂𝒍 = 𝟐𝟑
Intersección = 17 𝒖∝
13.
14. Paso 4
Una vez realizado todos los procedimientos correspondientes nos toca poner nuestra conclusión
Conclusión
𝒖𝒄𝒂𝒍 > 𝒖∝ No se rechaza la Ho
𝒖𝒄𝒂𝒍 ≤ 𝒖∝ se rechaza la Ho
23 > 17
No se rechaza la Ho . Esto quiere decir que la marca A (Delmont) y la marca B (Casino) tiene diferencias
en miligramos de Nicotina.