Análisis de Datos Bioestadística Medidas de Resumen de datos Norman y Streiner: Bioestadística, Cap. 3, Descripción de los...
Análisis de datos <ul><li>De acuerdo a tipo de variable: GRAFICARLOS. </li></ul><ul><li>Decidir: </li></ul><ul><ul><li>Nor...
Medidas de Resumen <ul><li>n: número de observaciones </li></ul><ul><li>Promedio o Media </li></ul><ul><li>Mediana </li></...
Promedio <ul><li>Sinónimo: media aritmética. </li></ul><ul><li>Otras medias: media armónica, media geométrica. </li></ul><...
Media <ul><li>De una muestra: x  </li></ul><ul><li>De una población :   </li></ul>
Resultados con Software estadístico (Systat)  <ul><li>CARIES </li></ul><ul><li>N of cases 10 </li></ul><ul><li>Minimum 5.0...
Mediana <ul><li>Valor que deja la mitad de los individuos por debajo de él, y la otra mitad, por encima. </li></ul>
Moda <ul><li>Categoría con mayor frecuencia </li></ul>
Medidas de dispersión <ul><li>Hace referencia a como se agrupan los datos alrededor de la medida de centralización, genera...
Recorrido intercuartil <ul><li>Se ordenan los datos y se dividen en cuatro partes iguales (cuartiles). </li></ul>   
<ul><li>Recorrido intercuartil: 50% se ubica en la zona central de los datos (gráfico de caja:  el ancho de la caja). </li...
Varianza <ul><li>Suma de desviaciones al cuadrado (se elimina de esa forma valores negativos), dividido por número de obse...
Desviación Estándar <ul><li> (x i  - x)  2  </li></ul><ul><li>   =     ------------------------ </li></...
Intervalo de confianza de un promedio (Confidence interval) <ul><li>Intervalo que incluye una serie de valores. </li></ul>...
DISTRIBUCIÓN NORMAL <ul><li>Forma de campana, también llamada distribución GAUSSIANA. </li></ul><ul><li>La curva norma tie...
Características de la curva normal <ul><ul><ul><li>Simétrica alrededor de la media (sesgo es 0, sesgo se refiere a la sime...
CALCULO DEL ÁREA BAJO UNA CURVA NORMAL <ul><li>Si el área total es 1 (ó 100%), y la media es 0, para cualquier variable ut...
<ul><li>Si por ejemplo, el promedio de caries, tiene un valor u y desviación stándard   o un determinado número de carie...
Valores tipificados <ul><li>Procedimiento que permite expresar cualquier valor inicial en términos de unidades de ds. Se d...
Valor tipificado <ul><li>Permite trabajar con una tabla única de la distribución normal. </li></ul><ul><li>Sirven para com...
Valores de z <ul><li>Area de la curva normal </li></ul> DS  DS  DS
<ul><li>CARIES </li></ul><ul><li>N of cases 10 </li></ul><ul><li>Minimum 5.000 </li></ul><ul><li>Maximum 10.000 </li></ul>...
Sesgo <ul><li>Si valor no es 0: dist es asimétrica </li></ul><ul><li>Valor +: indica larga cola a la der. </li></ul><ul><l...
Curtosis  (kurtosis) <ul><li>Curva más o menos aplanada. Depende de cantidad de casos.  </li></ul><ul><li>Entre más casos ...
Teorema central del límite <ul><li>La distribución de medias de muestras será aproximadamente normal indiferente de la dis...
<ul><li>La DS de la media (error estándar de la media ESM) depende de la DS de la muestra y del tamaño de la muestra. </li...
Teorema central del límite <ul><li>Si la población está o no distribuída normalmente, el promedio de muestras grandes (n >...
Distribución Normal <ul><li>DS:  </li></ul><ul><ul><li>Una DS: 68% de las observaciones. </li></ul></ul><ul><ul><li>Dos DS...
Distribución Normal <ul><li>La población tiene distribución definida por una media de m y una desviación estándar de s. </...
Propiedades de la curva normal <ul><li>Media, mediana y moda tienen el mismo valor. </li></ul><ul><li>Curva es simétrica r...
<ul><li>GENERO  =  0 </li></ul><ul><li>  NOTA1 </li></ul><ul><li>N of cases 49 </li></ul><ul><li>Minimum 3.997 </li></ul><...
Resumen <ul><li>Medidas de tendencia </li></ul><ul><li>Variable Medida </li></ul><ul><li>Nominal Moda </li></ul><ul><li>Or...
Próxima SlideShare
Cargando en…5
×

Medidas01

1.289 visualizaciones

Publicado el

0 comentarios
0 recomendaciones
Estadísticas
Notas
  • Sé el primero en comentar

  • Sé el primero en recomendar esto

Sin descargas
Visualizaciones
Visualizaciones totales
1.289
En SlideShare
0
De insertados
0
Número de insertados
1
Acciones
Compartido
0
Descargas
0
Comentarios
0
Recomendaciones
0
Insertados 0
No insertados

No hay notas en la diapositiva.

Medidas01

  1. 1. Análisis de Datos Bioestadística Medidas de Resumen de datos Norman y Streiner: Bioestadística, Cap. 3, Descripción de los datos mediante números. 1996: 14.
  2. 2. Análisis de datos <ul><li>De acuerdo a tipo de variable: GRAFICARLOS. </li></ul><ul><li>Decidir: </li></ul><ul><ul><li>Normalidad: Siga con el análisis. </li></ul></ul><ul><ul><li>Valores anormales: </li></ul></ul><ul><ul><ul><li>Revisar ingreso de datos </li></ul></ul></ul><ul><ul><ul><li>Eliminar ? - Defina el criterio </li></ul></ul></ul><ul><ul><ul><li>Transformarlos (log, raíz cuad, inverso, exp) </li></ul></ul></ul><ul><ul><ul><li>Volver a evaluar / medir. </li></ul></ul></ul>
  3. 3. Medidas de Resumen <ul><li>n: número de observaciones </li></ul><ul><li>Promedio o Media </li></ul><ul><li>Mediana </li></ul><ul><li>Moda </li></ul><ul><li>Percentiles </li></ul><ul><li>Desviación Estándar (DS) </li></ul><ul><li>Error estándar de la media (SEM) </li></ul>
  4. 4. Promedio <ul><li>Sinónimo: media aritmética. </li></ul><ul><li>Otras medias: media armónica, media geométrica. </li></ul><ul><li>Media aritmética : </li></ul><ul><li> x i </li></ul><ul><li>x = ------ </li></ul><ul><li>n i </li></ul>
  5. 5. Media <ul><li>De una muestra: x </li></ul><ul><li>De una población :  </li></ul>
  6. 6. Resultados con Software estadístico (Systat) <ul><li>CARIES </li></ul><ul><li>N of cases 10 </li></ul><ul><li>Minimum 5.000 </li></ul><ul><li>Maximum 10.000 </li></ul><ul><li>Mean 6.900 </li></ul><ul><li>Standard Dev 1.792 </li></ul>Valores: 10         
  7. 7. Mediana <ul><li>Valor que deja la mitad de los individuos por debajo de él, y la otra mitad, por encima. </li></ul>
  8. 8. Moda <ul><li>Categoría con mayor frecuencia </li></ul>
  9. 9. Medidas de dispersión <ul><li>Hace referencia a como se agrupan los datos alrededor de la medida de centralización, generalmente la media. </li></ul><ul><li>Rango: es la diferencia entre los valores extremos. Ej: Rango de la 3a. prueba grande de patología general: (6,1 - 2,7=3,4). </li></ul>
  10. 10. Recorrido intercuartil <ul><li>Se ordenan los datos y se dividen en cuatro partes iguales (cuartiles). </li></ul>   
  11. 11. <ul><li>Recorrido intercuartil: 50% se ubica en la zona central de los datos (gráfico de caja: el ancho de la caja). </li></ul><ul><li>Desviación media: Cuánto se aleja cada valor con respecto a la media? (x i - x). </li></ul><ul><li>Suma de las diferencias:  (x i - x). </li></ul><ul><li>Suma de diferencias de cualquier conjunto de datos es igual a 0. NO DICE MUCHO. </li></ul>
  12. 12. Varianza <ul><li>Suma de desviaciones al cuadrado (se elimina de esa forma valores negativos), dividido por número de observaciones. </li></ul><ul><li> (x i - x) 2 </li></ul><ul><li>s 2 = ------------------------ </li></ul><ul><li>N </li></ul>
  13. 13. Desviación Estándar <ul><li> (x i - x) 2 </li></ul><ul><li> =  ------------------------ </li></ul><ul><li>N </li></ul><ul><li> (x i - x) 2 </li></ul><ul><li>ds  =  ------------------------ </li></ul><ul><li>n - 1 </li></ul>Población Muestra
  14. 14. Intervalo de confianza de un promedio (Confidence interval) <ul><li>Intervalo que incluye una serie de valores. </li></ul><ul><li>Mean 5.469 </li></ul><ul><li>95% CI Upper 5.652 </li></ul><ul><li>95% CI Lower 5.287 </li></ul>
  15. 15. DISTRIBUCIÓN NORMAL <ul><li>Forma de campana, también llamada distribución GAUSSIANA. </li></ul><ul><li>La curva norma tiene algunas características, y es descrita por </li></ul><ul><li>1 1 - (x - u) 2 / 2  2 </li></ul><ul><ul><ul><li>f(x) = - - - - - - - - - = - - - - - - - - e </li></ul></ul></ul><ul><ul><ul><li> 2  2 (2  2 ) 1/2 </li></ul></ul></ul><ul><ul><ul><li> = 3,1416 </li></ul></ul></ul><ul><ul><ul><li> = des. st. de la población </li></ul></ul></ul><ul><ul><ul><li>u = media de la población </li></ul></ul></ul><ul><ul><ul><li>x = abscisa (Valor de x) </li></ul></ul></ul><ul><ul><ul><li>f(x)= ordenada, altura de la curva corresp. al valor de x. </li></ul></ul></ul><ul><ul><ul><li>e = 2,718... </li></ul></ul></ul>
  16. 16. Características de la curva normal <ul><ul><ul><li>Simétrica alrededor de la media (sesgo es 0, sesgo se refiere a la simetría de la curva). </li></ul></ul></ul><ul><ul><ul><li>Se describe con u y  </li></ul></ul></ul><ul><ul><ul><li>Área total bajo la curva es 1 </li></ul></ul></ul><ul><ul><ul><li>Área en una zona dada será <1 y >0 </li></ul></ul></ul><ul><ul><ul><li>Si se define un intervalo entre a y b el área de esa zona dará la probabilidad de observar un individuo en ese rango. </li></ul></ul></ul><ul><ul><ul><li>± 1  significa 68,27% </li></ul></ul></ul><ul><ul><ul><li>± 1.96  significa 95% </li></ul></ul></ul><ul><ul><ul><li>La media, mediana y el modo tienen el mismo valor. </li></ul></ul></ul><ul><ul><ul><li>Las colas cada vez se acercan más al eje x. </li></ul></ul></ul><ul><ul><ul><li>Curtosis mide si la curva es mas o menos plana, o picuda. </li></ul></ul></ul>
  17. 17. CALCULO DEL ÁREA BAJO UNA CURVA NORMAL <ul><li>Si el área total es 1 (ó 100%), y la media es 0, para cualquier variable utilizando una escala standard Z podemos obtener la probabilidad de obtener un valor mayor o menor, o en un rango dado. </li></ul><ul><li>Para calcular un área determinada bajo la curva de distribución normal los puntos de la variable x se convierten a la escala z y luego se utiliza la tabla de valores z adjunta. </li></ul>
  18. 18. <ul><li>Si por ejemplo, el promedio de caries, tiene un valor u y desviación stándard  o un determinado número de caries al valor en la escala z, se utiliza: </li></ul><ul><li>z = ( x - u )/  </li></ul><ul><ul><ul><li>sea el valor x es un número especificado de unidades de desviación stándard de la población con media u. </li></ul></ul></ul><ul><ul><ul><li>Por ejemplo si z = -1,25, el área izquierda de la curva es 0,1057 (0,5 - 0,3943), y a la derecha 1 - 0,1057 = 0,8943. </li></ul></ul></ul><ul><ul><ul><li>Si hay que determinar un área de la curva y ya hemos calculado z, o sea tenemos: </li></ul></ul></ul><ul><ul><ul><li>z = 0,25 área a la izq. es 0,5987 (0,0987 + 0,5) </li></ul></ul></ul><ul><ul><ul><li>z = -1,25 área a la izq. es 0,1056 (0,5 - 0,3943) </li></ul></ul></ul><ul><ul><ul><li>El área será : 0,5987 - 0,1056 = 0,4931 </li></ul></ul></ul>
  19. 19. Valores tipificados <ul><li>Procedimiento que permite expresar cualquier valor inicial en términos de unidades de ds. Se denomina z. </li></ul><ul><li> (x - x) </li></ul><ul><li>z = ----------- </li></ul><ul><li> ds </li></ul>
  20. 20. Valor tipificado <ul><li>Permite trabajar con una tabla única de la distribución normal. </li></ul><ul><li>Sirven para comparar valores procedents de varios tests o medidas. </li></ul>
  21. 21. Valores de z <ul><li>Area de la curva normal </li></ul> DS  DS  DS
  22. 22. <ul><li>CARIES </li></ul><ul><li>N of cases 10 </li></ul><ul><li>Minimum 5.000 </li></ul><ul><li>Maximum 10.000 </li></ul><ul><li>Range 5.000 </li></ul><ul><li>Sum 69.000 </li></ul><ul><li>Median 6.500 </li></ul><ul><li>Mean 6.900 </li></ul><ul><li>95% CI Upper 8.182 </li></ul><ul><li>95% CI Lower 5.618 </li></ul><ul><li>Std. Error 0.567 </li></ul><ul><li>Standard Dev 1.792 </li></ul><ul><li>Variance 3.211 </li></ul><ul><li>C.V. 0.260 </li></ul><ul><li>Skewness(G1) 0.475 </li></ul><ul><li>SE Skewness 0.687 </li></ul><ul><li>Kurtosis(G2) -1.056 </li></ul><ul><li>SE Kurtosis 1.334 </li></ul>
  23. 23. Sesgo <ul><li>Si valor no es 0: dist es asimétrica </li></ul><ul><li>Valor +: indica larga cola a la der. </li></ul><ul><li>Valor -: indica larga cola a la izq. </li></ul><ul><li>Skewness(G1) 0.024 </li></ul><ul><li>Skewness(G1) -0.816 </li></ul>
  24. 24. Curtosis (kurtosis) <ul><li>Curva más o menos aplanada. Depende de cantidad de casos. </li></ul><ul><li>Entre más casos más picuda. </li></ul><ul><li>Valor > 0: curva tiene cola más larga que una Dist N </li></ul><ul><li>Kurtosis(G2) 1.590 </li></ul><ul><li>Valor < 0: curva tiene zona más aplanada que una Dist N </li></ul><ul><li>Kurtosis(G2) -0.452 </li></ul>
  25. 25. Teorema central del límite <ul><li>La distribución de medias de muestras será aproximadamente normal indiferente de la distribución de valores en la población original de donde fueron tomados los valores. </li></ul><ul><li>El valor de la media de la colección de todos las posibles medias será igual a la media de la población. </li></ul>
  26. 26. <ul><li>La DS de la media (error estándar de la media ESM) depende de la DS de la muestra y del tamaño de la muestra. </li></ul><ul><li>Usted normalmete: no debe ocupar SEM ! </li></ul><ul><li>SEM = ds /  n </li></ul><ul><li>Grupo n x±ds SEM </li></ul><ul><li>B 76 27.2 ±4.6 0.5 </li></ul><ul><li>C 93 27.9 ±4.0 0.4 </li></ul><ul><li>D 9 14.9 ±4.6 1.5 </li></ul>
  27. 27. Teorema central del límite <ul><li>Si la población está o no distribuída normalmente, el promedio de muestras grandes (n > 30) se distribuye de forma normal. </li></ul>
  28. 28. Distribución Normal <ul><li>DS: </li></ul><ul><ul><li>Una DS: 68% de las observaciones. </li></ul></ul><ul><ul><li>Dos DS: 95% de las observaciones. </li></ul></ul><ul><ul><li>Tres DS: 99% de las observaciones. </li></ul></ul><ul><li>Altura de cualquier valor de x: </li></ul><ul><li>1 </li></ul><ul><li>------------- exp </li></ul><ul><li> </li></ul>   x - 
  29. 29. Distribución Normal <ul><li>La población tiene distribución definida por una media de m y una desviación estándar de s. </li></ul><ul><li>Normalmente se utiliza o analiza una muestra : x ± ds. </li></ul>
  30. 30. Propiedades de la curva normal <ul><li>Media, mediana y moda tienen el mismo valor. </li></ul><ul><li>Curva es simétrica respecto de la media, sesgo es 0. </li></ul><ul><li>La curtosis es 0. </li></ul><ul><li>Las colas están cada vez más cerca al eje X pero sin tocarlo, curva asintótica. </li></ul>
  31. 31. <ul><li>GENERO = 0 </li></ul><ul><li> NOTA1 </li></ul><ul><li>N of cases 49 </li></ul><ul><li>Minimum 3.997 </li></ul><ul><li>Maximum 6.77 </li></ul><ul><li>Range 2.777 </li></ul><ul><li>Sum 267.987 </li></ul><ul><li>Median 5.487 </li></ul><ul><li>Mean 5.469 </li></ul><ul><li>95% CI Upper 5.652 </li></ul><ul><li>95% CI Lower 5.287 </li></ul><ul><li>Std. Error 0.091 </li></ul><ul><li>Standard Dev 0.635 </li></ul><ul><li>Variance 0.404 </li></ul><ul><li>C.V. 0.116 </li></ul><ul><li>Skewness(G1) 0.024 </li></ul><ul><li>SE Skewness 0.340 </li></ul><ul><li>Kurtosis(G2) -0.452 </li></ul><ul><li>SE Kurtosis 0.668 </li></ul><ul><li>GENERO = 1 </li></ul><ul><li>NOTA1 </li></ul><ul><li>N of cases 43 </li></ul><ul><li>Minimum 2.665 </li></ul><ul><li>Maximum 6.323 </li></ul><ul><li>Range 3.658 </li></ul><ul><li>Sum 217.587 </li></ul><ul><li>Median 5.058 </li></ul><ul><li>Mean 5.060 </li></ul><ul><li>95% CI Upper 5.278 </li></ul><ul><li>95% CI Lower 4.842 </li></ul><ul><li>Std. Error 0.108 </li></ul><ul><li>Standard Dev 0.708 </li></ul><ul><li>Variance 0.501 </li></ul><ul><li>C.V. 0.140 </li></ul><ul><li>Skewness(G1) -0.816 </li></ul><ul><li>SE Skewness 0.361 </li></ul><ul><li>Kurtosis(G2) 1.590 </li></ul><ul><li>SE Kurtosis 0.709 </li></ul>
  32. 32. Resumen <ul><li>Medidas de tendencia </li></ul><ul><li>Variable Medida </li></ul><ul><li>Nominal Moda </li></ul><ul><li>Ordinal Moda, Mediana </li></ul><ul><li>Intervalar Moda, Mediana, Media, </li></ul><ul><li>Recorrido intercuartil, </li></ul><ul><li>DS </li></ul>

×