Prueba de hipotesis
Upcoming SlideShare
Loading in...5
×
 

Prueba de hipotesis

on

  • 4,910 reproducciones

 

Estadísticas

reproducciones

reproducciones totales
4,910
reproducciones en SlideShare
4,910
reproducciones incrustadas
0

Actions

Me gusta
1
Descargas
249
Comentarios
2

0 insertados 0

No embeds

Accesibilidad

Categorias

Detalles de carga

Uploaded via as Adobe PDF

Derechos de uso

© Todos los derechos reservados

Report content

Marcada como inapropiada Marcar como inapropiada
Marcar como inapropiada

Seleccione la razón para marcar esta presentación como inapropiada.

Cancelar
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Tu mensaje aparecerá aquí
    Processing...
  • Buenas diapositivas, sirven de ayuda para resolver problemas que se presentan a nivel clínico, medicina y otros...
    Are you sure you want to
    Tu mensaje aparecerá aquí
    Processing...
  • EXCELENTE TRABAJO, FELICITACIONES
    Are you sure you want to
    Tu mensaje aparecerá aquí
    Processing...
Publicar comentario
Edite su comentario

Prueba de hipotesis Prueba de hipotesis Presentation Transcript

  • Prueba de HipótesisDr. Cristian Díaz Vélez Epidemiólogo Clínico Auditor Médico
  •  Es el procedimiento que permite llegar a conclusiones acerca de una población a partir de la información que se obtiene de una muestra seleccionada de esa población. Se puede inferir a cerca de : Parámetros poblacionales Relaciones entre variables Predicción de resultados Cristian Díaz Vélez 3
  • Cristian Díaz Vélez 4
  • Estimación puntual: Es un solo valor numérico utilizado para estimar el parámetro correspondiente de la población.Estimación por intervalos : Consta de dos valores numéricos que definen un intervalo que, con un grado específico de confianza, incluye al parámetro por estimar. Cristian Díaz Vélez 5
  •  Se desea conocer los niveles de glicemia de los habitantes de un pueblo Se tomo una muestra de sangre de cada habitante del pueblo Se calcula el promedio y la desviación estándar Cristian Díaz Vélez 6
  • Estimación puntual:Nivel de glicemia La glicemia promedio de 70 la población es 100 mg/dl 80 90 100 μ =100 110 75 Estimación de intervalo: 85 95 195 σ = 35.6 El IC es igual a μ ± Z(σ /√n) 100 El IC: 100 ± 1.96 (35.6/ √100) : (93 , 107) Con una confianza de 95% el verdadero valor de la glicemia promedio de los habitantes se halla entre 93 a 107 mg/dl. Cristian Díaz Vélez 7
  •  Es el intervalo que contiene con determinada confianza al valor del parámetro poblacional, que se desea estimar. X - (Z(σ /√n) X X + (Z(σ /√n) Cristian Díaz Vélez 8
  • Cristian Díaz Vélez 9
  • Intervalo de confianza ≠ Rango Cristian Díaz Vélez 10
  • Cristian Díaz Vélez 11
  • Se sospecha que el Valor del Sodio sérico de los pacientes con Tuberculosis Miliar es diferente de la población general Se sustenta esta suposición en la observación de 3 pacientes que tienen la concentración de sodio sérico menos de 140 meq/l. El valor promedio observado de los tres pacientes fue 137.5 meq/l. Cristian Díaz Vélez 12
  • Los pasos solo son referenciales No absolutos Cristian Díaz Vélez 13
  •  1.- Establecer la Hipótesis (H0 y H1) 2.- Elección de la prueba estadística 3.- Nivel de significación 4.- Aplicación de la prueba 5.- Valor P 6.- La decisión Cristian Díaz Vélez 14
  • Cristian Díaz Vélez 15
  • Las hipótesis estadísticas son expresadas como relación entre variablesTradicionalmente se denomina: Hipótesis Nula (H0), aquella que expresa que no hay diferencia Hipótesis Alterna (H1), aquella que expresa que hay diferencia o asociación entre variables Cristian Díaz Vélez 16
  • Ante la sospecha que el Valor del Sodio sérico de los pacientes con Tuberculosis Miliar es diferente de la población general. La hipótesis a evaluar : H0: El nivel del sodio sérico en pacientes con tuberculosis miliar no difiere de la población general. H1: El nivel del sodio sérico en pacientes con tuberculosis miliar difiere de la población general. Cristian Díaz Vélez 17
  • Eficacia y seguridad del Tramadol subcutáneo vsendovenoso en el manejo del dolor agudo post operatorio en pacientes traumatológicos Cristian Díaz Vélez 18
  • Contraste Unilateral La Eficacia y seguridad del Tramadol subcutáneo es igual al endovenoso en el manejo del dolor agudo post operatorio en pacientes traumatológicos La Eficacia y seguridad del Tramadol subcutáneo es mayor al endovenoso en el manejo del dolor agudo post operatorio en pacientes traumatológicosContraste Bilateral La Eficacia y seguridad del Tramadol subcutáneo es igual al endovenoso en el manejo del dolor agudo post operatorio en pacientes traumatológicos La Eficacia y seguridad del Tramadol subcutáneo son diferentes al endovenoso en el manejo del dolor agudo post operatorio en pacientes traumatológicos Nivel de significancia: 95% Cristian Díaz Vélez 19
  • Supongamos que en estudio se obtuvo p = 0,03Entonces es 3%, como se uso nivel de significancia 95% (p<0,05)Vemos que el 3% (1,5% a cada lado de la cola) es menor de 5% y estaríaen el área sombreada. El “p” se interpreta sobre la hipótesis nulaConclusión: Se rechaza la hipótesis nula, por lo tanto se acepta la hipótesis alterna Cristian Díaz Vélez 20
  • Para tener en cuenta: Cuanto más grande sea la diferencia entre las dos variables, más fácil es demostrar que la diferencia es significativa. Cuanto más grande es el tamaño muestral más fácil es detectar diferencias entre los grupos. Cristian Díaz Vélez 21
  • Cristian Díaz Vélez 22
  •  Existen más de 300 pruebas estadísticas básicas. Hay dos clases de pruebas estadísticas: Las paramétricas y las no paramétricas. Cristian Díaz Vélez 23
  •  Los valores de la variable dependiente sigan la distribución de la curva normal en la muestra en la que se hizo la investigación. Las varianzas de los grupos que se comparan en una variable dependiente sean aproximadamente iguales (homogeneidad de las varianzas). La variable dependiente esté medida en una escala que sea por lo menos de intervalo, aunque este último requisito no es compartido por todos los estadísticos. Cuando los datos cumplen con los requisitos indicados, especialmente con los dos primeros, las pruebas estadísticas paramétricas exhiben su máximo poder. Cristian Díaz Vélez 24
  •  Las pruebas estadísticas no paramétricas, en cambio, no hacen a los datos ninguna de las exigencias que les hacen las pruebas estadísticas paramétricas; por eso se les denomina "pruebas estadísticas libres de distribución". Todas estas pruebas poseen menos poder que las pruebas paramétricas correspondientes, pero han demostrado ser muy útiles como alternativas cuando no se considera apropiado el uso de pruebas paramétricas. Cristian Díaz Vélez 25
  •  Tipo: Categórica/cualitativa Numérica/cuantitativa Escala: Categórica/cualitativa Nominal Ordinal Numérica/cuantitativa Razón Proporción Intervalo Cristian Díaz Vélez 26
  •  Categóricas nominales Dicotómicas Nominales ppd Categóricas ordinales Ordinales Numéricas proporción Numéricas razón Cuantitativas Cristian Díaz Vélez 27
  • Variable Dependiente Variable Prueba IndependienteDicotómica Dicotómica z, Chi-2, FisherDicotómica Nominal z, Chi-2, Metha-PatelDicotómica Ordinal Mann-Whitney / WilcoxonDicotómica Cuantitativa Regresión LogísticaNominal Dicotómica z, Chi-2, Metha-PatelNominal Cuantitativa Regresión DiscriminanteOrdinal Nominal Kruskal-WallisOrdinal Cuantitativa Regresión Odds ProporcionalCuantitativa Dicotómica t de StudentCuantitativa Nominal ANOVACuantitativa Cuantitativa Regresión Lineal, Cristian Díaz Vélez correlaciones 28
  • Identificar una variable dependiente Ninguna V. ind. Una V. ind. Más de una V. ind. V. Dep. V. Dep. V. Dep. V. Dep. V. Dep. V. Dep. V. Dep. V. Dep. V. Dep.Continua Ordinal Nominal Continua Ordinal Nominal Continua Ordinal Nominal 1 2 3 4 5 6 7 8 9 Para fines estadísticos una variable nominal solo se refiere a dos categorías de una Característica. Si la característica tiene K categorías, se necesitan K-1 variables. Cristian Díaz Vélez 29
  • 1 V. Dependiente ContinuaInterés en la Interés en la posición dispersión Media Varianza, DS Coef. Variación T student Chi2 T student Cristian Díaz Vélez 30
  • 2 Var. Depend. Ordinal Interés en la Interés en la posición dispersión Mediana AmplitudPrueba de Willcoxon intercuartilica Cristian Díaz Vélez 31
  • 3 V. Dependiente nominal Interés en la Si posición No Proporción TasaDesenlace Desenlace Aprox. Normal común raro PoissonBinomial Poisson Cristian Díaz Vélez 32
  • 4 V. Dependiente Continua No Interés en la Si posiciónDif. Medias T student Var. Indep Var. Indep intencionada aleatoria Regresión lineal Análisis Correlación T student T student Prueba F Z de Fisher Cristian Díaz Vélez 33
  • 5 Var. Depend. Ordinal Var. Indep. Var. Indep Nominal Ordinal Mediana Coef. CorrelaciónMann-Whitney Prueba Sperman Cristian Díaz Vélez 34
  • 6 Var. Depend. Nominal Var. Indep. Var. Indep. Nominal Ordinal o continua Datos Datos Chi2 paraapareados Indep. tendenciaP. McNemar Dif. Medias Chi2 Test Fisher Cristian Díaz Vélez 35
  • 7 Var. Depend. Ordinal Var. Indep. Var. Indep. Var. Indep Nominal continua Continua o nominal Var. Indep Var. Indep Var. Indep Var. Indep Datos Datos intencionada aleatoria intencionada aleatoriaapareados Indep. ANOVA ANOVA Análisis Análisis Análisis AnálisisFactorial Medidas Regresión Correlación Covarianza Correlaciónde una via repetidas múltiple múltiple (ANCOVA) múltiple Prueba F Prueba F Prueba F Prueba F Prueba F Prueba F Student Student F parcial F parcial F parcial F parcial Cristian Díaz Vélez 36
  • 8 V. Dependiente ordinal Var. Indep Nominal Datos Datos Indep. pareados Prueba Prueba FriedmanKruskal-Wallis Cristian Díaz Vélez 37
  • 9 Var. Depend. Nominal Var. Indep. Var. Indep Nominal Continua o nominal Dependiente No dependiente Del tiempo Del tiempo. Dependiente No dependiente Del tiempo Del tiempo. Análisis de Análisis Regresión Regresión AnálisisTablas de vida estratificado De Cox logística discriminante Log-rank Mantel-Haenszel Razón de Razón de Razón de chi2 Máxima Máxima Máxima probabilidad probabilidad probabilidad Cristian Díaz Vélez 38
  • Cristian Díaz Vélez 39
  • PRUEBAS PARAMETRICAS NUMERO DE GRUPOSPRUEBAS DE HIPOTESIS TIPO DE VARIABLE PRUEBA PRUEBAS NO PARAMETRICAS NUMERO DE GRUPOS TIPO DE VARIABLE PRUEBA 40
  • Si Prueba Z para la media 1 grupo Si n > = 30 Prueba T para la media Distribución normal No Prueba del signo No para la mediana Si Prueba Z para la ≠ media Si n > = 30 Si Prueba T Si Varianzas para ≠ de medias No Distribución iguales Prueba T normal No Con ajustes de g de libertad 2 grupos Número No Prueba de Mann Whitneyde grupos Independientes para comparación de poblac Si Prueba Z para la media de la ≠ en datos apareados Si Prueba T para la media de No La ≠ en datos apareados n > = 30 Distribución No normal Prueba del signo ó de No Wilcoxon para datos apareados Si 3 grupos Si Distribución ANVA Comparación de Ttos0 Normal c/varianzas semejantes No Prueba de krustal-Wallis-Comp Ttos Independientes Distribución Si Normal c/varianzas ANVA en bloque Comparación de Ttos No semejantes No Prueba de Friedman -Comp Ttos 41
  • 1 grupo Si Prueba Z para la proporción poblacional Muestra grande nP y n (1-P) > 5 No Prueba binomial p/ proporción poblacional Si Prueba exacta de Fisher Si Frecuencias Comparación de proporciones Esperadas pequeñas No Prueba Z o Prueba JI Cuadrado para 2 grupos Comparación de proporciones Númerode grupos Independientes No Prueba de McNemar Comparación de proporciones Si Prueba JI Cuadrado (reunir categorías) para comparación de proporciones Frecuencias 3 grupos Si Esperadas pequeñas No Prueba JI Cuadrado para Independientes Comparación de proporciones No Prueba Q de Cochran comparación de tratamientos 42
  • Continua Coeficiente de correlación lineal de PearsonEscala deMedición para Ordinal y/ó númerica ambas Coeficiente de correlación por rangos de Spearmanvariables Prueba JI Cuadrado (Coeficiente ǿ) Riesgo relativo (Estudios de cohorte) Odds ratio (Estudios de casos-control) Nominal Coeficiente de concordancia Kappa Cada variable (Comparación de métodos) Tiene dos Categorías (tabla de 2x2) Prueba de JI Cuadrado para independencia de variables (Coeficiente de contingencia) 43
  • Cristian Díaz Vélez 44
  • Los valores críticos de los errores en los estudios del área biomédica: Alfa () menor al 5% Beta () menor al 20%La confianza en 95% o másLa Potencia (1-β) 80% o más.El tamaño de la muestra influye. Cristian Díaz Vélez 45
  • 2.5% 2.5% No No esperada esperada Población EsperadaR. Rechazo Ho Región de no rechazo R. Rechazo Ho Cristian Díaz Vélez 46
  •  La confianza es de 95%, el error alfa se fija a lo mas en 5%. De modo similar se fija la potencia del estudio en 80%, por tal el error beta es a lo mas 20%. Cristian Díaz Vélez 47
  • La probabilidad de rechazar la hipótesis nula cuando en realidad es verdadera y es la “p”, por lo es un riesgo que asume el investigador de equivocarse al rechazar la hipótesis nula, cuando en realidad es cierta. Este riesgo se establece normalmente en 0.05 ó 0.01“Aceptar algo que es falso” Por lo tanto “p” no es un indicador de fuerza de la asociación ni de su importancia, sino una probabilidad. El error de tipo II consiste en aceptar la hipótesis nula cuando es falsa y esto se conoce como el error de tipo II o Beta (β ).“Rechazar algo que en realidad es verdadero” Cristian Díaz Vélez 48
  •  H0: El nivel del sodio sérico en pacientes con tuberculosis miliar no difiere de la población general. H1: El nivel del sodio sérico en pacientes con tuberculosis miliar difiere de la población general.Error α: Probabilidad de decir que el Sodio sérico es diferente en los pacientes con TBC miliar cuando en realidad son iguales.Error β: Probabilidad de decir que el Sodio sérico es igual en los pacientes con TBC miliar cuando en realidad son diferentes. Cristian Díaz Vélez 49
  • 1-β = Potencia “Aceptar (hipótesis alterna) algo que en realidad es verdadero” Probabilidad de aceptar la hipótesis alterna cuando realmente sea verdadera. Probabilidad de rechazar la hipótesis nula cuando realmente sea falsa. Cristian Díaz Vélez 50
  • 1-α = Nivel de confianza “Rechazar (hipótesis alterna) algo que es falso” Probabilidad de rechazar la hipótesis alterna cuando realmente sea falsa. Probabilidad de aceptar la hipótesis nula cuando realmente sea verdadera. Cristian Díaz Vélez 51
  •  Partimos con un nivel de confianza de 0,95 para la variable principal, es decir α = 0,05 Hipótesis: El nivel del sodio sérico en pacientes con tuberculosis miliar difiere de la población general. Análisis de subgrupos: Sexo, edad, nivel de instrucción. Hipótesis: El nivel del sodio sérico en pacientes con tuberculosis miliar difiere de la población general según sexo, edad. 0,95 x 0,95= 0,9025; α = 0,0975 Cristian Díaz Vélez 52
  • Cristian Díaz Vélez 53
  • Tolerancia de error ≠ Error tipo I Cristian Díaz Vélez 54
  •  Disponer de una teoría que guíe la investigación, evitando el "salir de pesca" con el ordenador buscando asociaciones entre variables. Disminuir el número de test estadísticos llevados a cabo en el estudio. Depurar la base de datos para evitar errores de valores extremos que puedan producir hallazgos significativos. Utilizar valores de “p” más reducidos (0.01 ó 0.001). Reproducir el estudio. Si al reproducir el estudio se obtienen resultados similares, estaremos más seguros de no estar cometiendo el error de tipo I. Cristian Díaz Vélez 55
  •  Incrementar el tamaño de la muestra. Estimar el poder estadístico del estudio. Incrementar el valor de “p”. Utilizar test paramétricos (más potentes) en lugar de test no paramétricos. Cristian Díaz Vélez 56
  • Una vez descartado loimposible, lo que queda, porimprobable que parezca, debeser la verdad.Sir Arthur Conan Doyle (1859-1930)
  • Cristian Díaz Vélez 58
  •  El término "estadísticamente significativo" invade la literatura médica y se percibe como una etiqueta que indicase "garantía de calidad". Los test de hipótesis son test de significación estadística. Cristian Díaz Vélez 59
  •  La significancia estadística viene dada por el nivel de Significancia que nos trazamos inicialmente. - Un nivel de significancia del 95% lleva implícito una p < de 0,05 - Y nivel de significancia del 99% lleva implícita una p < 0,01. En conclusión: cuanto más estadísticamente significativo sea, es menos probable de cometer el error tipo I. Al el error tipo I el error tipo II Cristian Díaz Vélez 60
  • Cristian Díaz Vélez 61
  •  Disponemos de 2 tratamientos (A y B). El tratamiento A lo reciben 25 pacientes y el tratamiento B otros 25 pacientes. 15 pacientes responden favorablemente al tratamiento A y 20 al tratamiento B. ¿Existe diferencia significativa entre ambos tratamientos? Ho (hipótesis nula) = No hay diferencia entre ambos tratamientos. Ha (hipótesis alternativa) = Sí existe diferencia entre ambos tratamientos.Nivel de significancia: 95% Cristian Díaz Vélez 62
  • p : 0,20 Si ahora la muestra es de 900 pacientes por grupo, se tiene que: p : 0,043Por lo tanto los valores de la "p“ deben ser considerados solo como una guíay no como base de conclusiones definitivas e irrevocables. Cristian Díaz Vélez 63
  • Cristian Díaz Vélez 64
  •  Poder estadístico o potencia estadística. Es el complemento del error tipo II (1-β). Es la probabilidad de rechazar la hipótesis nula cuando es realmente falsa o Probabilidad de aceptar la hipótesis alterna cuando realmente es verdadera. Representa la capacidad de un test para detectar como estadísticamente significativas diferencias o asociaciones de una magnitud determinada. Cristian Díaz Vélez 65
  •  El tamaño del efecto a detectar: > tamaño del efecto relevancia clínica. > probabilidad hallazgos significativos > poder estadístico. Variabilidad: A mayor variabilidad < probabilidad obtener diferencias < poder estadístico. Cristian Díaz Vélez 66
  •  El tamaño de la muestra: > muestra > potencia estadística. El nivel de significación estadística. valor α poder estadístico Es decir, si disminuimos la probabilidad de cometer un error de tipo I aumentamos simultáneamente la probabilidad de un error de tipo II (por lo tanto disminuye la potencia), por lo que se trata de encontrar un punto de “equilibrio” entre ambas. Generalmente, se suele trabajar con un poder en torno al 80% o al 90%. Cristian Díaz Vélez 67
  • Cristian Díaz Vélez 68
  • Cristian Díaz Vélez 69
  •  Para EVALUAR las hipótesis establecidas se debe realizar un estudio. Se toma una muestra de 35 pacientes con tuberculosis miliar y se realizará el dosaje de Na+ sérico. Entonces se comparará una muestra contra una población con parámetros conocidos. Cristian Díaz Vélez 70
  • x z   n Cristian Díaz Vélez 71
  •  Con los valores obtenidos, se calcula el estadístico de prueba Se trata de evaluar cuanto se asemejan los datos a lo que teóricamente sería la distribución si la hipótesis nula es verdadera Cristian Díaz Vélez 72
  • Si se tomó una muestra de 35 individuosSe sabe que en la población el sodio tiene una tipo Normal con  = 140 meq/l, y  = 2.5 meq/l.¿Qué prueba estadística se usaría? Cristian Díaz Vélez 73
  • x  El promedio de Sodioz   sérico en la muestra es 138 meq/l n 138 - 140Z = --------------- 2.5/ √35 El valor de la prueba para este ejercicio esZ = - 4,76 Z = -4,76 Cristian Díaz Vélez 74
  • Cristian Díaz Vélez 75
  •  El valor p , es la probabilidad de que por azar obtengamos un resultado como el tenemos en frente o mas extremo, asumiendo que no hay diferencia entre la población y la muestra estudiada. Cristian Díaz Vélez 76
  • La probabilidad deobtener -4 ,7 o aunmenos por Azar:0.0001 -4 Cristian Díaz Vélez 77
  • P  Se rechaza H0: =140 Y se acepta H1:  140 P X  138 Cristian Díaz Vélez 78
  • Cristian Díaz Vélez 79
  •  Luego de obtener los resultados se pudo calcular el valor “p,” que es la probabilidad de un resultado tanto o mas extremo que el que hemos encontrado a base de nuestros datos. Usualmente si cae en la región de rechazo (o p es menor que ) se rechaza H0 Cristian Díaz Vélez 80
  •  Se tomo una muestra de 35 individuos con tuberculosis miliar El promedio de Sodio de la muestra resultó en 138 meq/l ¿ 138 es diferente al de la población ? Tenemos que establecer un criterio para decidir si 138 es un valor esperado de la población general o no.¿ Cuales son los valores esperados ? Cristian Díaz Vélez 81
  • Cristian Díaz Vélez 82
  •  Ocurrió que el valor de Z es -4,7 Lo que corresponde a un valor de p = 0,0001 Dado que ese valor es menor que el valor alfa prefijado. Se rechaza la hipótesis nula. ACEPTAMOS LA HÍPOTESIS ALTERNA Cristian Díaz Vélez 83
  • Cristian Díaz Vélez 84
  • Cristian Díaz Vélez 85