SlideShare una empresa de Scribd logo
1 de 24
Descargar para leer sin conexión
1
METODOS ESTADISTICOS NO
PARAMETRICOS
• Las técnicas estadísticas de estimación de
parámetros, intervalos de confianza y prueba
de hipótesis son, en conjunto, denominadas
ESTADÍSTICA PARAMETRICA y son
aplicadas básicamente a variables continuas.
Estas técnicas se basan en especificar una
forma de distribución de la variable aleatoria
y de los estadísticos derivados de los datos.
• En ESTADÍSTICA PARAMETRICA se
asume que la población de la cual la muestra
es extraída es NORMAL o aproximadamente
normal. Esta propiedad es necesaria para
que la prueba de hipótesis sea valida.
• Sin embargo, en un gran numero de casos no
se puede determinar la distribucion original
ni la distribucion de los estadísticos por lo
que en realidad no tenemos parametros a
estimar. Tenemos solo distribuciones que
comparar. Esto se llama ESTADÍSTICA
NOPARAMETRICA.
2
La mayor desventaja de la ESTADÍSTICA NO
PARAMETRICA es que cuando los supuestos se
cumplen es mucho menos poderosa que la
ESTADÍSTICA PARAMETRICA.
LA PRUEBA DE SIGNO
Ejemplo
Estudio para comparar:
{la energia en reposo usada por personas con
cierta enfermedad} vs {la energia en reposo usada
por personas sanas}
Ho: no hay diferencias entre personas
sanas y enfermas
1) Se eligen al azar pares de personas (pacientes
de la misma edad, sexo, altura y peso) enfermas y
sanas y se calcula la diferencia para cada par
• diferencia >0 se asigna un signo +
• diferencia <0 se asigna un signo de -
3
Energia usada
por pacientes
Par enfermos sanos diferencia Signo
1 1153 996 157 +
2 1132 1080 52 +
3 1165 1182 -17 -
4 1460 1452 8 +
5 1634 1162 472 +
6 1493 1619 -126 -
7 1358 1140 218 +
8 1453 1123 330 +
9 1185 1113 72 +
10 1824 1463 361 +
11 1793 1632 161 +
12 1930 1614 316 +
13 2075 1836 239 +
2) Se cuenta el numero de positivos (D) y se
estudia la diferencia para cada par de
observaciones pero no se estudian los dos grupos
de personas individualmente como se hacia en las
pruebas parametricas.
4
Ho: no hay diferencias entre personas
sanas y enfermas o sea
-- hay el mismo numero de positivos
que de negativos
-- la probabilidad de + es de ½
-- la mediana de las diferencias es 0.
3) n pruebas Bernoulli independientes con p=1/2
(+) y (1-p)=1/2 (-). Por lo que el numero total de +
en D es una variable aleatoria con distribución
BINOMIAL con parámetros n y p.
Entonces el
promedio esperado de + np=n/2,
la varianza de + np(1-p)=n/4
desviación estándar de + [np(1-p)]1/2
=(n/4)1/2
4) entonces la hipótesis Ho se rechaza si D es
mucho mas grande o mas chico que n/2
• Parámetro -- diferencia
5
• Estimador -- D
• Est.-Par. D – (n/2)
SE(Est.) (n/4)1/2
Cuando n es grande Z+ se aproxima a una
distribucion normal estandard con media 0 y
varianza 1.
Para los datos anteriores
n/2=13/2=6.5
(n/4)1/2
=(13/4)1/2
=1.80
Z+=2.50
El area a la derecha e izquierda de
Z+ es 2(0.06)=0.012 (prueba a dos-colas)<0.05
entonces se rechaza la Ho de que no hay
diferencias entre las personas sanas y
enfermas.
Cuando n es chico usamos la distribución
Binomial para D asumiendo que Ho es
verdadera.
Z+
6
De acuerdo a Ho esperamos D=n/2=13/2=6.5
pero para los datos D=11. La probabilidad de
observar D=11 o D=12 o D=13 es
1113(0.5)11(0.5)
11
13 −








+ 1213(0.5)12(0.5)
12
13 −








+
13-13(0.5)13(0.5)
13
13








=0.0095+0.0016+0.0001
=0.0112 (una-cola) o
2(0.0112) (dos-colas).
Problema !
LA PRUEBA DE SIGNO NO TIENE EN
CUENTA LA MAGNITUD DE LA
DIFERENCIA
7
PRUEBA DE WILCOXON DEL SIGNO
DEL RANGO
Tiene en cuenta la magnitud de la diferencia.
-- se ordenan las diferencias por valor absoluto
-- diferencias positivas tienen un signo +
-- diferencias negativas tienen un signo -
-- se suman las diferencias con signo + y las
diferencias con signo -
Bajo la Ho de que la mediana=0 se espera que la
muestra tenga aproximadamente igual numero
de + que de – o sea que la suma de rangos
positivos=suma de rangos negativo
PRUEBA DE WILCOXON DE LA SUMA
DEL RANGO
Es la contraparte no parametrica de la prueba de
t.
8
La prueba de chi-cuadrado χ2
χ2
es definida como la suma de cuadrado de
variables independientes con distribución normal
media 0 y varianza 1.
2
i i i
σ
i
µ
i
Y
2Z2χ ∑ ∑
−
==












En el muestreo de una distribución normal la
cantidad SS=(n-1)s2
consiste en la suma de (n-1)
desviaciones independientes. Estas deviaciones
tienen media zero por lo que dividiendo por la
varianze comun σ2
aseguramos varianza de 1.
Entonces
2σ
21)s(n2χ −=
La distribución chi-cuadrada depende del numero de
desviaciones independientes, grados de libertad, y
no puede ser negativa ya que envuelve suma de
cuadrados.
9
χ2
es apropiada para datos que se agrupan en
categorías y se tienen celdas con observaciones de
tal forma que
∑
−
=
i esperado
2esperado)(observado2χ
Los valores observados son las observaciones
dentro de cada celda y los valores esperados son
aquellos referidos cuando la hipótesis nula es
verdadera.
Tablas de contingencia de 2 × 2
Estas tablas son comunes para sumarizar datos
categóricos. El interes radica en ver si las 2
categorias de la variable en las hileras esta
relacionada a las 2 categorias de la variable en las
columnas.
Columnas Total
Hileras 1 2
1 n11 n12 n1.
2 n21 n22 n2.
Total n.1 n.2 n
10
La hipótesis nula a probar es
Ho: NO HAY ASOCIACIÓN ENTRE HILERAS
Y COLUMNAS
Ejemplo
Respuesta
_______________
Favorable no favorable TOTAL
Tratamiento 16 48 64
Placebo 40 20 60
Ho: NO HAY ASOCIACIÓN ENTRE HILERAS
Y COLUMNAS O SEA LA PROPORCION DE
INDIVIDUOS QUE TIENEN RESPUESTA
FAVORABLE AL TRATAMIENTO ES IGUAL A
LA PROPORCION DE INDIVIDUOS CON
RESPUESTA NO FAVORABLE AL
TRATAMIENTO.
Ha: LA PROPORCION DE INDIVIDUOS CON
RESPUESTA FAVORABLE Y NO FAVORABLE
AL TRATAMIENTO ES DIFERENTE.
11
Programa SAS
Data a;
Input trat resultado conteo;
Placebo f 16
Placebo nf 48
Trat f 40
Trat nf 20
;
proc freq;
weight conteo;
tables trat*resultado/chisq;
run;
Salida del programa SAS
The SAS System 15:52 Tuesday, May 1, 2001
The FREQ Procedure
Table of trat by resultado
trat resultado
Frequency‚
Percent ‚
Row Pct ‚
Col Pct ‚f ‚nf ‚ Total
ƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆ
placebo ‚ 16 ‚ 48 ‚ 64
‚ 12.90 ‚ 38.71 ‚ 51.61
‚ 25.00 ‚ 75.00 ‚
‚ 28.57 ‚ 70.59 ‚
ƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆ
trat ‚ 40 ‚ 20 ‚ 60
‚ 32.26 ‚ 16.13 ‚ 48.39
‚ 66.67 ‚ 33.33 ‚
‚ 71.43 ‚ 29.41 ‚
ƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆ
Total 56 68 124
45.16 54.84 100.00
Statistics for Table of trat by resultado
Statistic DF Value Prob
ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ
Chi-Square 1 21.7087 <.0001
Likelihood Ratio Chi-Square 1 22.3768 <.0001
Continuity Adj. Chi-Square 1 20.0589 <.0001
Mantel-Haenszel Chi-Square 1 21.5336 <.0001
Phi Coefficient -0.4184
12
Contingency Coefficient 0.3860
Cramer's V -0.4184
Fisher's Exact Test
ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ
Cell (1,1) Frequency (F) 16
Left-sided Pr <= F 2.838E-06
Right-sided Pr >= F 1.0000
Table Probability (P) 2.397E-06
Two-sided Pr <= P 4.754E-06
Sample Size = 124
Comentarios
Con 124 observaciones y cada celda con mas de 10
observaciones todas los supuestos del muestreo para
el estadístico chi-cuadrado estan cumplidos.
Conclusión
SE RECHAZA LA Ho: NO HAY
ASOCIACIÓN ENTRE HILERAS Y
COLUMNAS y se concluye que el tratamiento tiene
un efecto mas favorable que el placebo.
13
EXTENSIÓN
El análisis de tablas de contingencia 2×2 se puede
extender a tablas de contingencia 2×r o s×2 o r×s y a
mas de una tabla r×s.
Prueba Wilcoxon-Mann-Whitney para 2-
muestras
Dos muestras independientes de igual tamano
(Wilcoxon, 1945)
Dos muestras independientes de diferente tamano
(Man and Whitney, 1947)
Ho: la distribucion de las observaciones de dos
muestras del mismo tamano son iguales.
Similar a la prueba t para comparar medias de
muestras de dos poblaciones.
Ejemplo
Relacion entre hipertensión y el consumo de
Sodium (NA+) en un grupo de 12 individuos
normales y un grupo de 10 individuos hipertensos.
14
Consumo de NA+
_________________
Normal Hipertenso
10.2 92.8
2.2 54.8
0.0 51.6
2.6 61.7
0.0 250.8
43.1 84.5
45.8 34.7
63.6 62.2
1.8 11.0
0.0 39.1
3.7
0.0
PROGRAMA SAS
data a;
input grupo $ individuo consumo;
cards;
normal 1 10.2
normal 2 2.2
normal 3 0.0
normal 4 2.6
normal 5 0.0
15
normal 6 43.1
normal 7 45.8
normal 8 63.6
normal 9 1.8
normal 10 0.0
normal 11 3.7
normal 12 0.0
hipertenso 1 92.8
hipertenso 2 54.8
hipertenso 3 51.6
hipertenso 4 61.7
hipertenso 5 250.8
hipertenso 6 84.5
hipertenso 7 34.7
hipertenso 8 62.2
hipertenso 9 11.0
hipertenso 10 39.1
;
proc freq data=a;
tables grupo*consumo / noprint cmh2 scores=rank;
proc freq data=a;
tables grupo*consumo / noprint chisq scores=rank;
proc npar1way wilcoxon;
class grupo;
var consumo;
run;
SALIDA DE SAS
The SAS System 10:13 Wednesday, May 2, 2001 6
The FREQ Procedure
Summary Statistics for grupo by consumo
Cochran-Mantel-Haenszel Statistics (Based on Rank Scores)
Statistic Alternative Hypothesis DF Value Prob
1 Nonzero Correlation 1 9.6589 0.0019
2 Row Mean Scores Differ 1 9.6589 0.0019
Total Sample Size = 22
The SAS System 10:13 Wednesday, May 2, 2001 7
The FREQ Procedure
16
Statistics for Table of grupo by consumo
Statistic DF Value Prob
Chi-Square 18 22.0000 0.2320
Likelihood Ratio Chi-Square 18 30.3164 0.0345
MH Chi-Square (Rank Scores) 1 9.6589 0.0019
Phi Coefficient 1.0000
Contingency Coefficient 0.7071
Cramer's V 1.0000
WARNING: 100% of the cells have expected counts less
than 5. Chi-Square may not be a valid test.
Sample Size = 2
The SAS System 10:13 Wednesday, May 2, 2001 8
The NPAR1WAY Procedure
Wilcoxon Scores (Rank Sums) for Variable consumo
Classified by Variable grupo
Sum of Expected Std Dev Mean
grupo N Scores Under H0 Under H0 Score
normal 12 91.0 138.0 15.122873 7.583333
hiperten 10 162.0 115.0 15.122873 16.200000
Average scores were used for ties.
Wilcoxon Two-Sample Test
Statistic 162.0000
Normal Approximation
Z 3.0748
One-Sided Pr > Z 0.0011
Two-Sided Pr > |Z| 0.0021
t Approximation
One-Sided Pr > Z 0.0029
Two-Sided Pr > |Z| 0.0057
Z includes a continuity correction of 0.5.
Kruskal-Wallis Test
Chi-Square 9.6589
DF 1
Pr > Chi-Square 0.0019
COMENTARIOS
17
• La opcion CMH2 en el programa SAS
especifica que la prueba de correlacion de
Cochran-Mantel-Haenszel es calculada. La
diferencia de las medias de scores tambien es
realizada y es igual a la correlacion de Cochran-
Mantel-Haenszel dado que hay solo dos grupos.
El metodo de Mantel-Haenszel combina
información de muchas tablas de 2×2
• El resultados del chi-cuadrado de 9.659 con 1 gl
y p=0.0019 indica que hay diferencias
significativas entre los individuos normales e
hipertensos en el consumo de NA+
Prueba Kruskal-Wallis para k-muestras
Generalización de la prueba de Wilcoxon-Mann-
Whitney para 2-muestras a mas de 2-muestras.
Ho: la respuesta tiene la misma distribución en
todos los grupos
18
Ejemplo
Se quiere saber si hay diferencias en los niveles de
cortisol en tres grupos de mujeres embarazadas al
momento del parto.
GRUPOS
I II III
262 465 343
307 501 772
211 455 207
323 355 1048
454 468 838
339 362 687
304
154
287
356
PROGRAMA SAS
data a;
input grupo $ individuo cortisol;
cards;
I 1 262
I 2 307
19
I 3 211
I 4 323
I 5 454
I 6 339
I 7 304
I 8 154
I 9 287
I 10 356
II 1 465
II 2 501
II 3 455
II 4 355
II 5 468
II 6 362
III 1 343
III 2 772
III 3 207
III 4 1048
III 5 838
III 6 687
;
proc freq data=a;
tables grupo*cortisol / noprint cmh2
scores=rank;
proc npar1way wilcoxon;
class grupo;
var cortisol;
run;
SALIDA DE SAS
The SAS System 10:13 Wednesday, May 2, 2001 11
The FREQ Procedure
Summary Statistics for grupo by cortisol
20
Cochran-Mantel-Haenszel Statistics (Based on Rank Scores)
Statistic Alternative Hypothesis DF Value Prob
1 Nonzero Correlation 1 8.2857 0.0040
2 Row Mean Scores Differ 2 9.2316 0.0099
Total Sample Size = 22
The SAS System 10:13 Wednesday, May 2, 2001 12
The NPAR1WAY Procedure
Wilcoxon Scores (Rank Sums) for Variable cortisol
Classified by Variable grupo
Sum of Expected Std Dev Mean
grupo N Scores Under H0 Under H0 Score
I 10 69.0 115.0 15.165751 6.900000
II 6 90.0 69.0 13.564660 15.000000
III 6 94.0 69.0 13.564660 15.666667
Kruskal-Wallis Test
Chi-Square 9.2316
DF 2
Pr > Chi-Square 0.0099
COMENTARIOS
• La prueba de Kuskal-Wallis definida como
Row Mean Score Difference es 9.232 con 2 gl
y un valor de p=0.010. Entonces la
distribución de los niveles de cortisol varia en
los tres grupos de mujeres.
21
• Como hay mas de dos grupos la correlacion
de Mantel-Haenszel no coincide con el Row
Mean Score.
22
REGRESIÓN LOGÍSTICA
Y =variable de respuesta que toma solo dos
valores 0,1 entonces la variable aleatoria es la
proporcion de veces (p) que Y toma valores de 1.
P(Y=1)
P(Y=0)
Se quiere modelar p en base a variables
explicatorias que influencian su valor.
Se hace una regresión de los valores de la
proporcion (p) en las variables independientes.
Sin embargo la regresión standard no es
apropiada por que las proporciones observadas
no tienen las mismas varianzas.
Se hace una regresión ponderada por las
varianzas de tal forma que observaciones con
mucha varianza se les da poco peso. Entonces, el
peso wi para la observacion ith
es
wi = )
i
p(1
i
p
i
N ˆˆ −
23
Entonces
p=a+b1x1
donde x1 representa los pesos.
Pero como p varia entre 0 y 1 y el termino a+b1x1
varia entre valores que pueden caer fuera de ese
rango este modelo no es factible. Sin embargo el
modelo
p=ea+b
1
x
1
asegura que p es positivo pero puede ser >1. Este
problema se soluciona con el modelo siguiente
p=(ea+b
1
x
1)/ (1+ea+b
1
x
1)
Esta es la FUNCION LOGISTICA que restringe
el valor de p a estar entre 0 y 1.
Entonces
p/(1-p)= [ea+b
1
x
1/ (1+ea+b
1
x
1)]/[1/(1+ea+b
1
x
1)]= ea+b
1
x
1
p/(1-p)= ea+b
1
x
1
24
log[p/(1-p)]= log[ea+b
1
x
1]
log[p/(1-p)]=a+b1x1 Modelo Logistico
La tecnica de ajustar un modelo de esta forma se
llama REGRESION LOGÍSTICA y la relacion
entre p y x1 NO es lineal.
NOTA
El odd de un evento que sucede con probabilidad
p esta dado por
p/(1-p)
Para p=1/2, (1-p)=1/2 entonces el odd del evento
es 1 a 1.
Para p=2/3, (1-p)=1/3 entonces el odd del evento
es 2 a 1.

Más contenido relacionado

La actualidad más candente

A salmonella typhi
A salmonella typhiA salmonella typhi
A salmonella typhi
favis Cuneja
 
Toxoplasmosis
ToxoplasmosisToxoplasmosis
Toxoplasmosis
USAC
 
Candida albicans
Candida albicansCandida albicans
Candida albicans
LCG
 
Chinche de cama (cimex lectularius) (3)
Chinche de cama (cimex lectularius) (3)Chinche de cama (cimex lectularius) (3)
Chinche de cama (cimex lectularius) (3)
gladysdiazrubio
 

La actualidad más candente (20)

Trichomona vaginalis
Trichomona vaginalisTrichomona vaginalis
Trichomona vaginalis
 
A salmonella typhi
A salmonella typhiA salmonella typhi
A salmonella typhi
 
Clasificación de heridas
Clasificación de heridasClasificación de heridas
Clasificación de heridas
 
Trichomonas
TrichomonasTrichomonas
Trichomonas
 
Toxoplasmosis
ToxoplasmosisToxoplasmosis
Toxoplasmosis
 
herpes virus
herpes virusherpes virus
herpes virus
 
Tricomoniasis
TricomoniasisTricomoniasis
Tricomoniasis
 
Candidiasis
CandidiasisCandidiasis
Candidiasis
 
Candida albicans
Candida albicansCandida albicans
Candida albicans
 
tricomoniasis.pptx
tricomoniasis.pptxtricomoniasis.pptx
tricomoniasis.pptx
 
TRICHOPHYTON (7).pptx
TRICHOPHYTON  (7).pptxTRICHOPHYTON  (7).pptx
TRICHOPHYTON (7).pptx
 
Chinche de cama (cimex lectularius) (3)
Chinche de cama (cimex lectularius) (3)Chinche de cama (cimex lectularius) (3)
Chinche de cama (cimex lectularius) (3)
 
Chlamydia
ChlamydiaChlamydia
Chlamydia
 
Brucellosis
BrucellosisBrucellosis
Brucellosis
 
Toxoplasmosis
ToxoplasmosisToxoplasmosis
Toxoplasmosis
 
Taenia
Taenia Taenia
Taenia
 
Dermatofitosis
DermatofitosisDermatofitosis
Dermatofitosis
 
Tricomoniasis
TricomoniasisTricomoniasis
Tricomoniasis
 
Virus del herpes tipo 1 y 2
Virus del herpes tipo 1 y 2Virus del herpes tipo 1 y 2
Virus del herpes tipo 1 y 2
 
Uncinarias
UncinariasUncinarias
Uncinarias
 

Destacado

Significancia estadistica – relevancia clinica
Significancia estadistica – relevancia clinicaSignificancia estadistica – relevancia clinica
Significancia estadistica – relevancia clinica
ramolina22
 
Estadistica Vs Significancia Clinica
Estadistica Vs Significancia ClinicaEstadistica Vs Significancia Clinica
Estadistica Vs Significancia Clinica
PsicologiaURSE
 
Calculo de significancia_estadistica
Calculo de significancia_estadisticaCalculo de significancia_estadistica
Calculo de significancia_estadistica
nakadi
 
Test de Hipótesis I
Test de Hipótesis ITest de Hipótesis I
Test de Hipótesis I
Hector Funes
 
Pruebas de significancia estadística
Pruebas de significancia estadísticaPruebas de significancia estadística
Pruebas de significancia estadística
Nelly González
 
Pruebas paramétricaspresentacion.pptx
Pruebas paramétricaspresentacion.pptxPruebas paramétricaspresentacion.pptx
Pruebas paramétricaspresentacion.pptx
Yulianny Luque
 
Unidad 8 Eleccion de la prueba de significacion estadistica
Unidad 8 Eleccion de la prueba de significacion estadisticaUnidad 8 Eleccion de la prueba de significacion estadistica
Unidad 8 Eleccion de la prueba de significacion estadistica
Ricardo Ruiz de Adana
 
Frecuencia estadística
Frecuencia estadística Frecuencia estadística
Frecuencia estadística
Ricardo Muzante
 
Estadística inferencial
Estadística inferencialEstadística inferencial
Estadística inferencial
Magdalena B
 
Pruebas estadisticas
Pruebas estadisticasPruebas estadisticas
Pruebas estadisticas
lady
 
Muestreo aleatorio simple
Muestreo aleatorio simpleMuestreo aleatorio simple
Muestreo aleatorio simple
milit
 

Destacado (20)

Significancia estadistica – relevancia clinica
Significancia estadistica – relevancia clinicaSignificancia estadistica – relevancia clinica
Significancia estadistica – relevancia clinica
 
Estadistica Vs Significancia Clinica
Estadistica Vs Significancia ClinicaEstadistica Vs Significancia Clinica
Estadistica Vs Significancia Clinica
 
Prueba de hipótesis
Prueba de hipótesisPrueba de hipótesis
Prueba de hipótesis
 
La significancia en las pruebas estadísticas ¿qué son y para qué sirven?
La significancia en las pruebas estadísticas ¿qué son y para qué sirven?La significancia en las pruebas estadísticas ¿qué son y para qué sirven?
La significancia en las pruebas estadísticas ¿qué son y para qué sirven?
 
Calculo de significancia_estadistica
Calculo de significancia_estadisticaCalculo de significancia_estadistica
Calculo de significancia_estadistica
 
Inferencia en RLS, datos atípicos. Aplicación
Inferencia en RLS, datos atípicos.  AplicaciónInferencia en RLS, datos atípicos.  Aplicación
Inferencia en RLS, datos atípicos. Aplicación
 
Test de Hipótesis I
Test de Hipótesis ITest de Hipótesis I
Test de Hipótesis I
 
Pruebas de significancia estadística
Pruebas de significancia estadísticaPruebas de significancia estadística
Pruebas de significancia estadística
 
Pruebas paramétricaspresentacion.pptx
Pruebas paramétricaspresentacion.pptxPruebas paramétricaspresentacion.pptx
Pruebas paramétricaspresentacion.pptx
 
Unidad 8 Eleccion de la prueba de significacion estadistica
Unidad 8 Eleccion de la prueba de significacion estadisticaUnidad 8 Eleccion de la prueba de significacion estadistica
Unidad 8 Eleccion de la prueba de significacion estadistica
 
Frecuencia estadística
Frecuencia estadística Frecuencia estadística
Frecuencia estadística
 
Pruebas parametricas y no parametricas
Pruebas parametricas y no parametricasPruebas parametricas y no parametricas
Pruebas parametricas y no parametricas
 
Analisis multivariado
Analisis multivariadoAnalisis multivariado
Analisis multivariado
 
Prueba de los signos
Prueba de los signosPrueba de los signos
Prueba de los signos
 
Estadística inferencial
Estadística inferencialEstadística inferencial
Estadística inferencial
 
Pruebas estadisticas
Pruebas estadisticasPruebas estadisticas
Pruebas estadisticas
 
Estadistica
EstadisticaEstadistica
Estadistica
 
Entrevista para orientación vocacional formato
Entrevista para orientación vocacional formatoEntrevista para orientación vocacional formato
Entrevista para orientación vocacional formato
 
Muestreo aleatorio simple
Muestreo aleatorio simpleMuestreo aleatorio simple
Muestreo aleatorio simple
 
Conceptos Básicos de la Estadística
Conceptos Básicos de la EstadísticaConceptos Básicos de la Estadística
Conceptos Básicos de la Estadística
 

Similar a Significancia estadistica

Analisis de la_varianza_
Analisis de la_varianza_Analisis de la_varianza_
Analisis de la_varianza_
J M
 
Trabajo de pruebas no paraemtricas 6 metodos
Trabajo de pruebas no paraemtricas 6 metodosTrabajo de pruebas no paraemtricas 6 metodos
Trabajo de pruebas no paraemtricas 6 metodos
jimmynter
 
pruebas no paraemtricas
pruebas no paraemtricas pruebas no paraemtricas
pruebas no paraemtricas
jimmynter
 
Trabajo de pruebas no paraemtricas 6 metodos
Trabajo de pruebas no paraemtricas 6 metodosTrabajo de pruebas no paraemtricas 6 metodos
Trabajo de pruebas no paraemtricas 6 metodos
jimmynter
 
La prueba o estadístico chi cuadrado se utiliza para comprobar si la diferenc...
La prueba o estadístico chi cuadrado se utiliza para comprobar si la diferenc...La prueba o estadístico chi cuadrado se utiliza para comprobar si la diferenc...
La prueba o estadístico chi cuadrado se utiliza para comprobar si la diferenc...
fatima_m_p
 
Planteamiento de Hipótesis para dos poblaciones (WORD)
Planteamiento de Hipótesis para dos poblaciones (WORD)Planteamiento de Hipótesis para dos poblaciones (WORD)
Planteamiento de Hipótesis para dos poblaciones (WORD)
HOTELES2
 
SEMANA12- CON. ANALISIS DE LA VARIANZA.pdf
SEMANA12- CON. ANALISIS DE LA VARIANZA.pdfSEMANA12- CON. ANALISIS DE LA VARIANZA.pdf
SEMANA12- CON. ANALISIS DE LA VARIANZA.pdf
PabloTorres474113
 

Similar a Significancia estadistica (20)

Analisis de la_varianza_
Analisis de la_varianza_Analisis de la_varianza_
Analisis de la_varianza_
 
Estadistica ad
Estadistica adEstadistica ad
Estadistica ad
 
Chi cuadrada
Chi cuadradaChi cuadrada
Chi cuadrada
 
Trabajo de pruebas no paraemtricas 6 metodos
Trabajo de pruebas no paraemtricas 6 metodosTrabajo de pruebas no paraemtricas 6 metodos
Trabajo de pruebas no paraemtricas 6 metodos
 
pruebas no paraemtricas
pruebas no paraemtricas pruebas no paraemtricas
pruebas no paraemtricas
 
Trabajo de pruebas no paraemtricas 6 metodos
Trabajo de pruebas no paraemtricas 6 metodosTrabajo de pruebas no paraemtricas 6 metodos
Trabajo de pruebas no paraemtricas 6 metodos
 
La prueba o estadístico chi cuadrado se utiliza para comprobar si la diferenc...
La prueba o estadístico chi cuadrado se utiliza para comprobar si la diferenc...La prueba o estadístico chi cuadrado se utiliza para comprobar si la diferenc...
La prueba o estadístico chi cuadrado se utiliza para comprobar si la diferenc...
 
Ejercicios de probabilidad 2
Ejercicios de probabilidad 2Ejercicios de probabilidad 2
Ejercicios de probabilidad 2
 
Planteamiento de Hipótesis para dos poblaciones (WORD)
Planteamiento de Hipótesis para dos poblaciones (WORD)Planteamiento de Hipótesis para dos poblaciones (WORD)
Planteamiento de Hipótesis para dos poblaciones (WORD)
 
Clase ANOVA.ppt
Clase ANOVA.pptClase ANOVA.ppt
Clase ANOVA.ppt
 
Ph2 m
Ph2 mPh2 m
Ph2 m
 
SEMANA12- CON. ANALISIS DE LA VARIANZA.pdf
SEMANA12- CON. ANALISIS DE LA VARIANZA.pdfSEMANA12- CON. ANALISIS DE LA VARIANZA.pdf
SEMANA12- CON. ANALISIS DE LA VARIANZA.pdf
 
Trabajo 1 estadistica
Trabajo 1 estadisticaTrabajo 1 estadistica
Trabajo 1 estadistica
 
Diapositivas
DiapositivasDiapositivas
Diapositivas
 
GRUPO D (1).pptx
GRUPO D (1).pptxGRUPO D (1).pptx
GRUPO D (1).pptx
 
EJERCICIOS DE INFERENCIA ESTADÍSTICA 2023.pptx
EJERCICIOS DE INFERENCIA ESTADÍSTICA 2023.pptxEJERCICIOS DE INFERENCIA ESTADÍSTICA 2023.pptx
EJERCICIOS DE INFERENCIA ESTADÍSTICA 2023.pptx
 
La estadística descriptiva resume la información conteni- da en los datos re...
La estadística descriptiva  resume la información conteni- da en los datos re...La estadística descriptiva  resume la información conteni- da en los datos re...
La estadística descriptiva resume la información conteni- da en los datos re...
 
Tema 1 (1).ppt
Tema 1 (1).pptTema 1 (1).ppt
Tema 1 (1).ppt
 
Tema 1.ppt
Tema 1.pptTema 1.ppt
Tema 1.ppt
 
UTPL-BIOESTADÍSTICA-II BIMESTRE-(OCTUBRE 2011-FEBRERO 2012)
UTPL-BIOESTADÍSTICA-II BIMESTRE-(OCTUBRE 2011-FEBRERO 2012)UTPL-BIOESTADÍSTICA-II BIMESTRE-(OCTUBRE 2011-FEBRERO 2012)
UTPL-BIOESTADÍSTICA-II BIMESTRE-(OCTUBRE 2011-FEBRERO 2012)
 

Último

SEMANA 01 - ASISTENCIA AL USUARIO CON PATOLOGIAS
SEMANA 01 - ASISTENCIA AL USUARIO CON PATOLOGIASSEMANA 01 - ASISTENCIA AL USUARIO CON PATOLOGIAS
SEMANA 01 - ASISTENCIA AL USUARIO CON PATOLOGIAS
JessBerrocal3
 
Clase 17 Artrologia MMII 3 de 3 (Pie) 2024 (1).pdf
Clase 17 Artrologia MMII 3 de 3 (Pie) 2024 (1).pdfClase 17 Artrologia MMII 3 de 3 (Pie) 2024 (1).pdf
Clase 17 Artrologia MMII 3 de 3 (Pie) 2024 (1).pdf
garrotamara01
 
higiene y saneamiento en los establecimientos farmaceuticos
higiene y saneamiento en los establecimientos farmaceuticoshigiene y saneamiento en los establecimientos farmaceuticos
higiene y saneamiento en los establecimientos farmaceuticos
MedalytHuashuayoCusi
 
Clase 16 Artrologia mmii 2 de 3 (Rodilla y Tobillo) 2024.pdf
Clase 16 Artrologia mmii 2 de 3 (Rodilla y Tobillo) 2024.pdfClase 16 Artrologia mmii 2 de 3 (Rodilla y Tobillo) 2024.pdf
Clase 16 Artrologia mmii 2 de 3 (Rodilla y Tobillo) 2024.pdf
garrotamara01
 

Último (20)

MAPA EnfermedadesCerebrovasculares...pdf
MAPA EnfermedadesCerebrovasculares...pdfMAPA EnfermedadesCerebrovasculares...pdf
MAPA EnfermedadesCerebrovasculares...pdf
 
317543696-CUMARINA-EXPOSICION-ORGANICA4.pptx
317543696-CUMARINA-EXPOSICION-ORGANICA4.pptx317543696-CUMARINA-EXPOSICION-ORGANICA4.pptx
317543696-CUMARINA-EXPOSICION-ORGANICA4.pptx
 
2024 GUÍA DE RESPUESTA EN CASO DE EMERGENCIA.pdf
2024 GUÍA DE RESPUESTA EN CASO DE EMERGENCIA.pdf2024 GUÍA DE RESPUESTA EN CASO DE EMERGENCIA.pdf
2024 GUÍA DE RESPUESTA EN CASO DE EMERGENCIA.pdf
 
Enfermedad de Parkinson. Enfermedades Neurológicas y Conducta
Enfermedad de Parkinson. Enfermedades Neurológicas y ConductaEnfermedad de Parkinson. Enfermedades Neurológicas y Conducta
Enfermedad de Parkinson. Enfermedades Neurológicas y Conducta
 
Manejo de antibioticos en pediatria .pptx
Manejo de antibioticos en pediatria .pptxManejo de antibioticos en pediatria .pptx
Manejo de antibioticos en pediatria .pptx
 
SEMANA 01 - ASISTENCIA AL USUARIO CON PATOLOGIAS
SEMANA 01 - ASISTENCIA AL USUARIO CON PATOLOGIASSEMANA 01 - ASISTENCIA AL USUARIO CON PATOLOGIAS
SEMANA 01 - ASISTENCIA AL USUARIO CON PATOLOGIAS
 
Clase 17 Artrologia MMII 3 de 3 (Pie) 2024 (1).pdf
Clase 17 Artrologia MMII 3 de 3 (Pie) 2024 (1).pdfClase 17 Artrologia MMII 3 de 3 (Pie) 2024 (1).pdf
Clase 17 Artrologia MMII 3 de 3 (Pie) 2024 (1).pdf
 
presentacion de CUMARINAS clase maestraa
presentacion de CUMARINAS clase maestraapresentacion de CUMARINAS clase maestraa
presentacion de CUMARINAS clase maestraa
 
EDEMA VASCULAR con enfoque en semiologia
EDEMA VASCULAR con enfoque en semiologiaEDEMA VASCULAR con enfoque en semiologia
EDEMA VASCULAR con enfoque en semiologia
 
Relación de pacientes con el personal de enfermeria.pptx
Relación de pacientes con el personal de enfermeria.pptxRelación de pacientes con el personal de enfermeria.pptx
Relación de pacientes con el personal de enfermeria.pptx
 
Neurocirugía Hoy, Volume 17, Numero 53__
Neurocirugía Hoy, Volume 17, Numero 53__Neurocirugía Hoy, Volume 17, Numero 53__
Neurocirugía Hoy, Volume 17, Numero 53__
 
asincronias ventilatorias-ventilacion mecanica
asincronias ventilatorias-ventilacion mecanicaasincronias ventilatorias-ventilacion mecanica
asincronias ventilatorias-ventilacion mecanica
 
Cuadernillo de depresion. ejercicios practicos
Cuadernillo de depresion. ejercicios practicosCuadernillo de depresion. ejercicios practicos
Cuadernillo de depresion. ejercicios practicos
 
IMSS-Presentacion-2024 para poder iniciar expo
IMSS-Presentacion-2024 para poder iniciar expoIMSS-Presentacion-2024 para poder iniciar expo
IMSS-Presentacion-2024 para poder iniciar expo
 
1. HISTORIA DE LA FISIOTERAPIA EN EL MUNDO.pptx
1. HISTORIA DE LA FISIOTERAPIA EN EL MUNDO.pptx1. HISTORIA DE LA FISIOTERAPIA EN EL MUNDO.pptx
1. HISTORIA DE LA FISIOTERAPIA EN EL MUNDO.pptx
 
higiene y saneamiento en los establecimientos farmaceuticos
higiene y saneamiento en los establecimientos farmaceuticoshigiene y saneamiento en los establecimientos farmaceuticos
higiene y saneamiento en los establecimientos farmaceuticos
 
libro Langman Embriologia Medica 14edicion
libro Langman Embriologia Medica 14edicionlibro Langman Embriologia Medica 14edicion
libro Langman Embriologia Medica 14edicion
 
Clase 16 Artrologia mmii 2 de 3 (Rodilla y Tobillo) 2024.pdf
Clase 16 Artrologia mmii 2 de 3 (Rodilla y Tobillo) 2024.pdfClase 16 Artrologia mmii 2 de 3 (Rodilla y Tobillo) 2024.pdf
Clase 16 Artrologia mmii 2 de 3 (Rodilla y Tobillo) 2024.pdf
 
(2024-09-05) Mutilacion genital femenina (DOC).docx
(2024-09-05) Mutilacion genital femenina (DOC).docx(2024-09-05) Mutilacion genital femenina (DOC).docx
(2024-09-05) Mutilacion genital femenina (DOC).docx
 
FARMCOCINÉTICA Y FARMACODINAMIA DE LOS MEDICAMENTOS TÓPICOS
FARMCOCINÉTICA Y FARMACODINAMIA DE LOS MEDICAMENTOS TÓPICOSFARMCOCINÉTICA Y FARMACODINAMIA DE LOS MEDICAMENTOS TÓPICOS
FARMCOCINÉTICA Y FARMACODINAMIA DE LOS MEDICAMENTOS TÓPICOS
 

Significancia estadistica

  • 1. 1 METODOS ESTADISTICOS NO PARAMETRICOS • Las técnicas estadísticas de estimación de parámetros, intervalos de confianza y prueba de hipótesis son, en conjunto, denominadas ESTADÍSTICA PARAMETRICA y son aplicadas básicamente a variables continuas. Estas técnicas se basan en especificar una forma de distribución de la variable aleatoria y de los estadísticos derivados de los datos. • En ESTADÍSTICA PARAMETRICA se asume que la población de la cual la muestra es extraída es NORMAL o aproximadamente normal. Esta propiedad es necesaria para que la prueba de hipótesis sea valida. • Sin embargo, en un gran numero de casos no se puede determinar la distribucion original ni la distribucion de los estadísticos por lo que en realidad no tenemos parametros a estimar. Tenemos solo distribuciones que comparar. Esto se llama ESTADÍSTICA NOPARAMETRICA.
  • 2. 2 La mayor desventaja de la ESTADÍSTICA NO PARAMETRICA es que cuando los supuestos se cumplen es mucho menos poderosa que la ESTADÍSTICA PARAMETRICA. LA PRUEBA DE SIGNO Ejemplo Estudio para comparar: {la energia en reposo usada por personas con cierta enfermedad} vs {la energia en reposo usada por personas sanas} Ho: no hay diferencias entre personas sanas y enfermas 1) Se eligen al azar pares de personas (pacientes de la misma edad, sexo, altura y peso) enfermas y sanas y se calcula la diferencia para cada par • diferencia >0 se asigna un signo + • diferencia <0 se asigna un signo de -
  • 3. 3 Energia usada por pacientes Par enfermos sanos diferencia Signo 1 1153 996 157 + 2 1132 1080 52 + 3 1165 1182 -17 - 4 1460 1452 8 + 5 1634 1162 472 + 6 1493 1619 -126 - 7 1358 1140 218 + 8 1453 1123 330 + 9 1185 1113 72 + 10 1824 1463 361 + 11 1793 1632 161 + 12 1930 1614 316 + 13 2075 1836 239 + 2) Se cuenta el numero de positivos (D) y se estudia la diferencia para cada par de observaciones pero no se estudian los dos grupos de personas individualmente como se hacia en las pruebas parametricas.
  • 4. 4 Ho: no hay diferencias entre personas sanas y enfermas o sea -- hay el mismo numero de positivos que de negativos -- la probabilidad de + es de ½ -- la mediana de las diferencias es 0. 3) n pruebas Bernoulli independientes con p=1/2 (+) y (1-p)=1/2 (-). Por lo que el numero total de + en D es una variable aleatoria con distribución BINOMIAL con parámetros n y p. Entonces el promedio esperado de + np=n/2, la varianza de + np(1-p)=n/4 desviación estándar de + [np(1-p)]1/2 =(n/4)1/2 4) entonces la hipótesis Ho se rechaza si D es mucho mas grande o mas chico que n/2 • Parámetro -- diferencia
  • 5. 5 • Estimador -- D • Est.-Par. D – (n/2) SE(Est.) (n/4)1/2 Cuando n es grande Z+ se aproxima a una distribucion normal estandard con media 0 y varianza 1. Para los datos anteriores n/2=13/2=6.5 (n/4)1/2 =(13/4)1/2 =1.80 Z+=2.50 El area a la derecha e izquierda de Z+ es 2(0.06)=0.012 (prueba a dos-colas)<0.05 entonces se rechaza la Ho de que no hay diferencias entre las personas sanas y enfermas. Cuando n es chico usamos la distribución Binomial para D asumiendo que Ho es verdadera. Z+
  • 6. 6 De acuerdo a Ho esperamos D=n/2=13/2=6.5 pero para los datos D=11. La probabilidad de observar D=11 o D=12 o D=13 es 1113(0.5)11(0.5) 11 13 −         + 1213(0.5)12(0.5) 12 13 −         + 13-13(0.5)13(0.5) 13 13         =0.0095+0.0016+0.0001 =0.0112 (una-cola) o 2(0.0112) (dos-colas). Problema ! LA PRUEBA DE SIGNO NO TIENE EN CUENTA LA MAGNITUD DE LA DIFERENCIA
  • 7. 7 PRUEBA DE WILCOXON DEL SIGNO DEL RANGO Tiene en cuenta la magnitud de la diferencia. -- se ordenan las diferencias por valor absoluto -- diferencias positivas tienen un signo + -- diferencias negativas tienen un signo - -- se suman las diferencias con signo + y las diferencias con signo - Bajo la Ho de que la mediana=0 se espera que la muestra tenga aproximadamente igual numero de + que de – o sea que la suma de rangos positivos=suma de rangos negativo PRUEBA DE WILCOXON DE LA SUMA DEL RANGO Es la contraparte no parametrica de la prueba de t.
  • 8. 8 La prueba de chi-cuadrado χ2 χ2 es definida como la suma de cuadrado de variables independientes con distribución normal media 0 y varianza 1. 2 i i i σ i µ i Y 2Z2χ ∑ ∑ − ==             En el muestreo de una distribución normal la cantidad SS=(n-1)s2 consiste en la suma de (n-1) desviaciones independientes. Estas deviaciones tienen media zero por lo que dividiendo por la varianze comun σ2 aseguramos varianza de 1. Entonces 2σ 21)s(n2χ −= La distribución chi-cuadrada depende del numero de desviaciones independientes, grados de libertad, y no puede ser negativa ya que envuelve suma de cuadrados.
  • 9. 9 χ2 es apropiada para datos que se agrupan en categorías y se tienen celdas con observaciones de tal forma que ∑ − = i esperado 2esperado)(observado2χ Los valores observados son las observaciones dentro de cada celda y los valores esperados son aquellos referidos cuando la hipótesis nula es verdadera. Tablas de contingencia de 2 × 2 Estas tablas son comunes para sumarizar datos categóricos. El interes radica en ver si las 2 categorias de la variable en las hileras esta relacionada a las 2 categorias de la variable en las columnas. Columnas Total Hileras 1 2 1 n11 n12 n1. 2 n21 n22 n2. Total n.1 n.2 n
  • 10. 10 La hipótesis nula a probar es Ho: NO HAY ASOCIACIÓN ENTRE HILERAS Y COLUMNAS Ejemplo Respuesta _______________ Favorable no favorable TOTAL Tratamiento 16 48 64 Placebo 40 20 60 Ho: NO HAY ASOCIACIÓN ENTRE HILERAS Y COLUMNAS O SEA LA PROPORCION DE INDIVIDUOS QUE TIENEN RESPUESTA FAVORABLE AL TRATAMIENTO ES IGUAL A LA PROPORCION DE INDIVIDUOS CON RESPUESTA NO FAVORABLE AL TRATAMIENTO. Ha: LA PROPORCION DE INDIVIDUOS CON RESPUESTA FAVORABLE Y NO FAVORABLE AL TRATAMIENTO ES DIFERENTE.
  • 11. 11 Programa SAS Data a; Input trat resultado conteo; Placebo f 16 Placebo nf 48 Trat f 40 Trat nf 20 ; proc freq; weight conteo; tables trat*resultado/chisq; run; Salida del programa SAS The SAS System 15:52 Tuesday, May 1, 2001 The FREQ Procedure Table of trat by resultado trat resultado Frequency‚ Percent ‚ Row Pct ‚ Col Pct ‚f ‚nf ‚ Total ƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆ placebo ‚ 16 ‚ 48 ‚ 64 ‚ 12.90 ‚ 38.71 ‚ 51.61 ‚ 25.00 ‚ 75.00 ‚ ‚ 28.57 ‚ 70.59 ‚ ƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆ trat ‚ 40 ‚ 20 ‚ 60 ‚ 32.26 ‚ 16.13 ‚ 48.39 ‚ 66.67 ‚ 33.33 ‚ ‚ 71.43 ‚ 29.41 ‚ ƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆ Total 56 68 124 45.16 54.84 100.00 Statistics for Table of trat by resultado Statistic DF Value Prob ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ Chi-Square 1 21.7087 <.0001 Likelihood Ratio Chi-Square 1 22.3768 <.0001 Continuity Adj. Chi-Square 1 20.0589 <.0001 Mantel-Haenszel Chi-Square 1 21.5336 <.0001 Phi Coefficient -0.4184
  • 12. 12 Contingency Coefficient 0.3860 Cramer's V -0.4184 Fisher's Exact Test ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ Cell (1,1) Frequency (F) 16 Left-sided Pr <= F 2.838E-06 Right-sided Pr >= F 1.0000 Table Probability (P) 2.397E-06 Two-sided Pr <= P 4.754E-06 Sample Size = 124 Comentarios Con 124 observaciones y cada celda con mas de 10 observaciones todas los supuestos del muestreo para el estadístico chi-cuadrado estan cumplidos. Conclusión SE RECHAZA LA Ho: NO HAY ASOCIACIÓN ENTRE HILERAS Y COLUMNAS y se concluye que el tratamiento tiene un efecto mas favorable que el placebo.
  • 13. 13 EXTENSIÓN El análisis de tablas de contingencia 2×2 se puede extender a tablas de contingencia 2×r o s×2 o r×s y a mas de una tabla r×s. Prueba Wilcoxon-Mann-Whitney para 2- muestras Dos muestras independientes de igual tamano (Wilcoxon, 1945) Dos muestras independientes de diferente tamano (Man and Whitney, 1947) Ho: la distribucion de las observaciones de dos muestras del mismo tamano son iguales. Similar a la prueba t para comparar medias de muestras de dos poblaciones. Ejemplo Relacion entre hipertensión y el consumo de Sodium (NA+) en un grupo de 12 individuos normales y un grupo de 10 individuos hipertensos.
  • 14. 14 Consumo de NA+ _________________ Normal Hipertenso 10.2 92.8 2.2 54.8 0.0 51.6 2.6 61.7 0.0 250.8 43.1 84.5 45.8 34.7 63.6 62.2 1.8 11.0 0.0 39.1 3.7 0.0 PROGRAMA SAS data a; input grupo $ individuo consumo; cards; normal 1 10.2 normal 2 2.2 normal 3 0.0 normal 4 2.6 normal 5 0.0
  • 15. 15 normal 6 43.1 normal 7 45.8 normal 8 63.6 normal 9 1.8 normal 10 0.0 normal 11 3.7 normal 12 0.0 hipertenso 1 92.8 hipertenso 2 54.8 hipertenso 3 51.6 hipertenso 4 61.7 hipertenso 5 250.8 hipertenso 6 84.5 hipertenso 7 34.7 hipertenso 8 62.2 hipertenso 9 11.0 hipertenso 10 39.1 ; proc freq data=a; tables grupo*consumo / noprint cmh2 scores=rank; proc freq data=a; tables grupo*consumo / noprint chisq scores=rank; proc npar1way wilcoxon; class grupo; var consumo; run; SALIDA DE SAS The SAS System 10:13 Wednesday, May 2, 2001 6 The FREQ Procedure Summary Statistics for grupo by consumo Cochran-Mantel-Haenszel Statistics (Based on Rank Scores) Statistic Alternative Hypothesis DF Value Prob 1 Nonzero Correlation 1 9.6589 0.0019 2 Row Mean Scores Differ 1 9.6589 0.0019 Total Sample Size = 22 The SAS System 10:13 Wednesday, May 2, 2001 7 The FREQ Procedure
  • 16. 16 Statistics for Table of grupo by consumo Statistic DF Value Prob Chi-Square 18 22.0000 0.2320 Likelihood Ratio Chi-Square 18 30.3164 0.0345 MH Chi-Square (Rank Scores) 1 9.6589 0.0019 Phi Coefficient 1.0000 Contingency Coefficient 0.7071 Cramer's V 1.0000 WARNING: 100% of the cells have expected counts less than 5. Chi-Square may not be a valid test. Sample Size = 2 The SAS System 10:13 Wednesday, May 2, 2001 8 The NPAR1WAY Procedure Wilcoxon Scores (Rank Sums) for Variable consumo Classified by Variable grupo Sum of Expected Std Dev Mean grupo N Scores Under H0 Under H0 Score normal 12 91.0 138.0 15.122873 7.583333 hiperten 10 162.0 115.0 15.122873 16.200000 Average scores were used for ties. Wilcoxon Two-Sample Test Statistic 162.0000 Normal Approximation Z 3.0748 One-Sided Pr > Z 0.0011 Two-Sided Pr > |Z| 0.0021 t Approximation One-Sided Pr > Z 0.0029 Two-Sided Pr > |Z| 0.0057 Z includes a continuity correction of 0.5. Kruskal-Wallis Test Chi-Square 9.6589 DF 1 Pr > Chi-Square 0.0019 COMENTARIOS
  • 17. 17 • La opcion CMH2 en el programa SAS especifica que la prueba de correlacion de Cochran-Mantel-Haenszel es calculada. La diferencia de las medias de scores tambien es realizada y es igual a la correlacion de Cochran- Mantel-Haenszel dado que hay solo dos grupos. El metodo de Mantel-Haenszel combina información de muchas tablas de 2×2 • El resultados del chi-cuadrado de 9.659 con 1 gl y p=0.0019 indica que hay diferencias significativas entre los individuos normales e hipertensos en el consumo de NA+ Prueba Kruskal-Wallis para k-muestras Generalización de la prueba de Wilcoxon-Mann- Whitney para 2-muestras a mas de 2-muestras. Ho: la respuesta tiene la misma distribución en todos los grupos
  • 18. 18 Ejemplo Se quiere saber si hay diferencias en los niveles de cortisol en tres grupos de mujeres embarazadas al momento del parto. GRUPOS I II III 262 465 343 307 501 772 211 455 207 323 355 1048 454 468 838 339 362 687 304 154 287 356 PROGRAMA SAS data a; input grupo $ individuo cortisol; cards; I 1 262 I 2 307
  • 19. 19 I 3 211 I 4 323 I 5 454 I 6 339 I 7 304 I 8 154 I 9 287 I 10 356 II 1 465 II 2 501 II 3 455 II 4 355 II 5 468 II 6 362 III 1 343 III 2 772 III 3 207 III 4 1048 III 5 838 III 6 687 ; proc freq data=a; tables grupo*cortisol / noprint cmh2 scores=rank; proc npar1way wilcoxon; class grupo; var cortisol; run; SALIDA DE SAS The SAS System 10:13 Wednesday, May 2, 2001 11 The FREQ Procedure Summary Statistics for grupo by cortisol
  • 20. 20 Cochran-Mantel-Haenszel Statistics (Based on Rank Scores) Statistic Alternative Hypothesis DF Value Prob 1 Nonzero Correlation 1 8.2857 0.0040 2 Row Mean Scores Differ 2 9.2316 0.0099 Total Sample Size = 22 The SAS System 10:13 Wednesday, May 2, 2001 12 The NPAR1WAY Procedure Wilcoxon Scores (Rank Sums) for Variable cortisol Classified by Variable grupo Sum of Expected Std Dev Mean grupo N Scores Under H0 Under H0 Score I 10 69.0 115.0 15.165751 6.900000 II 6 90.0 69.0 13.564660 15.000000 III 6 94.0 69.0 13.564660 15.666667 Kruskal-Wallis Test Chi-Square 9.2316 DF 2 Pr > Chi-Square 0.0099 COMENTARIOS • La prueba de Kuskal-Wallis definida como Row Mean Score Difference es 9.232 con 2 gl y un valor de p=0.010. Entonces la distribución de los niveles de cortisol varia en los tres grupos de mujeres.
  • 21. 21 • Como hay mas de dos grupos la correlacion de Mantel-Haenszel no coincide con el Row Mean Score.
  • 22. 22 REGRESIÓN LOGÍSTICA Y =variable de respuesta que toma solo dos valores 0,1 entonces la variable aleatoria es la proporcion de veces (p) que Y toma valores de 1. P(Y=1) P(Y=0) Se quiere modelar p en base a variables explicatorias que influencian su valor. Se hace una regresión de los valores de la proporcion (p) en las variables independientes. Sin embargo la regresión standard no es apropiada por que las proporciones observadas no tienen las mismas varianzas. Se hace una regresión ponderada por las varianzas de tal forma que observaciones con mucha varianza se les da poco peso. Entonces, el peso wi para la observacion ith es wi = ) i p(1 i p i N ˆˆ −
  • 23. 23 Entonces p=a+b1x1 donde x1 representa los pesos. Pero como p varia entre 0 y 1 y el termino a+b1x1 varia entre valores que pueden caer fuera de ese rango este modelo no es factible. Sin embargo el modelo p=ea+b 1 x 1 asegura que p es positivo pero puede ser >1. Este problema se soluciona con el modelo siguiente p=(ea+b 1 x 1)/ (1+ea+b 1 x 1) Esta es la FUNCION LOGISTICA que restringe el valor de p a estar entre 0 y 1. Entonces p/(1-p)= [ea+b 1 x 1/ (1+ea+b 1 x 1)]/[1/(1+ea+b 1 x 1)]= ea+b 1 x 1 p/(1-p)= ea+b 1 x 1
  • 24. 24 log[p/(1-p)]= log[ea+b 1 x 1] log[p/(1-p)]=a+b1x1 Modelo Logistico La tecnica de ajustar un modelo de esta forma se llama REGRESION LOGÍSTICA y la relacion entre p y x1 NO es lineal. NOTA El odd de un evento que sucede con probabilidad p esta dado por p/(1-p) Para p=1/2, (1-p)=1/2 entonces el odd del evento es 1 a 1. Para p=2/3, (1-p)=1/3 entonces el odd del evento es 2 a 1.