SlideShare una empresa de Scribd logo
1 de 29
Bioestadística
Estadígrafos
Parámetros y estadígrafo
 Parámetro: Es una cantidad numérica calculada sobre una
población
 La altura media de los individuos de un país
 La idea es resumir toda la información que hay en la población en unos
pocos números (parámetros).
 Estadígrafo: Ídem (cambiar población por muestra)
 La altura media de los que estamos en este aula.
 Somos una muestra (¿representativa?) de la población.
 Si un estadígrafo se usa para aproximar un parámetro también se le suele
llamar estimador.
Normalmente nos interesa conocer un parámetro, pero por la dificultad que
conlleva estudiar a *TODA* la población, calculamos un estimador sobre una
muestra y “confiamos” en que sean próximos. Más adelante veremos como
elegir muestras para que el error sea “confiablemente” pequeño.
 Posición
 Dividen un conjunto ordenado de datos en grupos con la
misma cantidad de individuos.
 Cuantiles, percentiles, cuartiles,...
 Centralización
 Indican valores con respecto a los que los datos parecen
agruparse.
 Media, mediana y moda
 Dispersión
 Indican la mayor o menor concentración de los datos con
respecto a las medidas de centralización.
 Desviación típica, coeficiente de variación, rango, varianza
 Forma
 Asimetría
 Apuntamiento o curtosis
Estadígrafos de posición
 Se define el cuantil de orden a como un valor de la variable por debajo del
cual se encuentra una frecuencia acumulada a.
 Casos particulares son los percentiles, cuartiles, deciles, quintiles,...
Estadígrafos de posición
Percentil de orden k = cuantil de orden k/100
 Valor tal que al menos p por ciento de los datos son menores
que o igual a ese valor y (100-p) por ciento de los datos son
mayores que o iguales a ese valor.
 La mediana es el percentil 50
 El percentil de orden 15 deja por debajo al 15% de las
observaciones. Por encima queda el 85%
Cuartiles: Dividen a la muestra en 4 grupos con
frecuencias similares.
 Primer cuartil = Percentil 25 = Cuantil 0,25
 Segundo cuartil = Percentil 50 = Cuantil 0,5 = mediana
 Tercer cuartil = Percentil 75 = cuantil 0,75
Ejemplos
 El 5% de los recién nacidos tiene un peso demasiado bajo. ¿Qué
peso se considera “demasiado bajo”?
 Percentil 5 o cuantil 0,05
Percentil 5 del peso
Peso al nacer (Kg) de 100 niños
frecuencia
1 2 3 4 5
0
5
10
15
20
25
¿Qué peso es superado sólo por el 25% de los individuos?
 Percentil 75 o tercer cuartil
Percentil 75 del peso
Peso (Kg) de 100 deportistas
frecuencia
50 55 60 65 70 75 80 85
0
5
10
15
20
25
30
Ejemplos
 El colesterol se distribuye simétricamente en la población. Supongamos
que se consideran patológicos los valores extremos. El 90% de los
individuos son normales ¿Entre qué valores se encuentran los individuos
normales?
Percentiles 5 y 95
Colesterol en 100 personas
frecuencia
180 200 220 240 260
0
5
10
15
20 Ejemplos
 ¿Entre qué valores se encuentran la mitad de los individuos “más
normales” de una población en cuanto a altura?
 Entre el cuartil 1º y 3º
Percentiles 25 y 75
Altura (cm) en 100 varones
frecuencia
150 160 170 180 190
0
5
10
15
20
Ejemplos
Estadígrafos de centralización
Añaden unos cuantos casos particulares a las medidas de posición. En
este caso son medidas que buscan posiciones (valores) con
respecto a los cuales los datos muestran tendencia a agruparse.
 Media (‘mean’) Es la media aritmética (promedio) de los valores de
una variable. Suma de los valores dividido por el tamaño muestral.
 Media de 2,2,3,7 es (2+2+3+7)/4=3,5
 Conveniente cuando los datos se concentran simétricamente con
respecto a ese valor. Muy sensible a valores extremos.
 Centro de gravedad de los datos
 Mediana (‘median’) Es un valor que divide a las observaciones en
dos grupos con el mismo número de individuos (percentil 50). Si el
número de datos es par, se elige la media de los dos datos centrales.
 Mediana de 1,2,4,5,6,6,8 es 5
 Mediana de 1,2,4,5,6,6,8,9 es (5+6)/2=5,5
 Es conveniente cuando los datos son asimétricos. No es sensible
a valores extremos.
 Mediana de 1,2,4,5,6,6,800 es 5. ¡La media es 117,7!
 Moda (‘mode’) Es el/los valor/es donde la distribución de frecuencia
alcanza un máximo.
Altura mediana
Algunas fórmulas
 Datos sin agrupar: x1, x2, ..., xn
 ejemplo promedio.jpg
 Datos organizados en tabla
 si está considerado la frecuencia, esta se debe tomar
en cuenta a la hora de considerar el valor de i.
 Media
n
x
x i i


Variable fr. fr. ac.
L0 – L1 x1 n1 N1
L1 – L2 x2 n2 N2
...
Lk-1 – Lk xk nk Nk
n
n
f
x
x i i
i


Algunas fórmulas-fórmula práctica de percentiles
 Datos ordenados: x1, x2, ..., xn
 Percentiles
Ordenar los datos de menor a mayor.
Calcular (p/100)*n
Si (p/100)*n es un entero, promediar el
valor de la observación ordenada y el
siguiente valor mayor en la lista ordenada
de los datos.
Si (p/100)*n no es un entero, seleccionar
la próxima observación mayor en la lista
ordenada de los datos.
Algunas fórmulas-fórmula práctica de percentiles
Ejemplo: Número de
organismos
coliformes/ml de leche
en siete muestras.
5, 8, 6, 7, 8, 2, 3
Lista ordenada: 2, 3,
5, 6, 7, 8, 8
 n = 7; p = 50
(50/100)*7 = 3.5,
escoja el cuarto de la
lista
2, 3, 5, 6, 7, 8, 8
 n = 7; p = 25
(25/100)*7 = 1.75,
escoja el segundo de
la lista
2, 3, 5, 6, 7, 8, 8
Diagramas de Tukey
 Resumen con 5 números:
 Mínimo, cuartiles y máximo.
 Suelen dar una buena idea de
la distribución.
 La zona central, ‘caja’,
contiene al 50% central de las
observaciones.
 Su tamaño se llama ‘rango
intercuartílico’ (R.I.)
 Es costumbre que ‘los
bigotes’, no lleguen hasta los
extremos, sino hasta las
observaciones que se separan
de la caja en no más de 1,5
R.I.
 Más allá de esa distancia se
consideran anómalas, y así se
marcan.
Diagrama de cajas de Tukey: Resumen en 5 números
Velocidad (Km/h) de 200 vehículos en ciudad
densidad
40 45 50 55 60 65
0.00
0.02
0.04
0.06
0.08
40 45 50 55 60 65
Mín. P25 P50 P75 Máx.
Diagrama de cajas de Tukey: Resumen en 5 números
Velocidad (Km/h) de 200 vehículos en autovía
densidad
80 90 100 110 120 130 140
0.00
0.01
0.02
0.03
0.04
80 90 100 110 120 130 140
Mín. P25 P50 P75 Máx.
Diagrama de Tukey o Boxplot
Dato menor no atípico
Mediana
Dato mayor
no atípico
Box-and-Whisker Plot
Altura
150 160 170 180 190 200
Dato atípico
Q1
Q3
Media
Dato atípico
Variabilidad o dispersión
 Los estudiantes de Bioestadística reciben diferentes calificaciones en la asignatura
(variabilidad). ¿A qué puede deberse?
 Diferencias individuales en el conocimiento de la materia.
 ¿Podría haber otras razones (fuentes de variabilidad)?
 Por ejemplo supongamos que todos los alumnos poseen el mismo nivel de
conocimiento. ¿Las notas serían las mismas en todos? Seguramente No.
 Dormir poco el día del examen, el pan con queso estaba envenenado...
 Diferencias individuales en la habilidad para hacer un examen.
 El examen no es una medida perfecta del conocimiento.
 Variabilidad por error de medida.
 En alguna pregunta difícil, se duda entre varias opciones, y al azar se elige la
mala
 Variabilidad por azar, aleatoriedad.
Medidas de dispersión
Miden el grado de dispersión (variabilidad) de los datos, independientemente de su
causa.
 Amplitud o Rango (‘range’):
Diferencia entre observaciónes extremas.
 2,1,4,3,8,4. El rango es 8-1=7
 Es muy sensible a los valores extremos.
 Rango intercuartílico (‘interquartile range’):
 Es la distancia entre primer y tercer cuartil.
 Rango intercuartílico = P75 - P25
 Parecida al rango, pero eliminando las observaciones más extremas inferiores
y superiores.
 No es tan sensible a valores extremos.
150 160 170 180 190
0.00
0.01
0.02
0.03
0.04
0.05
150 160 170 180 190
25% 25% 25% 25%
Mín. P25 P50 P75 Máx.
Rango intercuartílico
Rango
Varianza S2 (‘Variance’): Mide el promedio de las
desviaciones (al cuadrado) de las observaciones
con respecto a la media.
 Es sensible a valores extremos (alejados de la media).
 Sus unidades son el cuadrado de las de la variable. De
interpretación difícil para un principiante.
 Cálculo tradicional
Varianza S2 (‘Variance’): Existe una expresión que
es mas sencilla de realizar.
Donde SS es la suma de cuadrados:
SS =  xi
2 – (xi) 2/ n
“Machine formula”
Desviación típica (‘standard deviation’)
Es la raíz cuadrada de la varianza
 Tiene las misma dimensionalidad
(unidades) que la variable. Versión
‘estética’ de la varianza.
 Cierta distribución que veremos más
adelante (normal o gaussiana)
quedará completamente determinada
por la media y la desviación típica.
 A una distancia de una desv. típica de la
media hay ‘más de la mitad’.
 A una distancia de dos desv. típica de la
media las tendremos casi todas.
Peso recién nacidos en partos gemelares
3.300
2.900
2.500
2.100
1.700
1.300
900
500
50
40
30
20
10
0
Desv. típ. = 568,43
Media = 2023
N = 407,00
Dispersión en distribuciones ‘normales’
150 160 170 180 190
0.00
0.01
0.02
0.03
0.04
0.05
x s
68.5 %
150 160 170 180 190
0.00
0.01
0.02
0.03
0.04
0.05
x 2s
95 %
Centrado en la media y a una desv. típica de distancia hay
aproximadamente el 68% de las observaciones.
A dos desviaciones típicas tenemos el 95% (aprox.)
Coeficiente de variación
Es la razón entre la desviación típica y la media.
 Mide la desviación típica en forma de
“qué tamaño tiene con respecto a la media”
 También se la denomina variabilidad relativa.
 Es frecuente mostrarla en porcentajes
 Si la media es 80 y la desviación típica 20 entonces CV=20/80=0,25=25% (variabilidad
relativa)
 Es una cantidad adimensional. Interesante para comparar la variabilidad de
diferentes variables.
 Si el peso tiene CV=30% y la altura tiene CV=10%, los individuos presentan más
dispersión en peso que en altura.
 No debe usarse cuando la variable presenta valores negativos o donde el valor
0 sea una cantidad fijada arbitrariamente
 Por ejemplo 0ºC ≠ 0ºF
Asimetría o Sesgo
 Una distribución es simétrica si la
mitad izquierda de su distribución
es la imagen espejo de su mitad
derecha.
 En las distribuciones simétricas
media y mediana coinciden. Si sólo
hay una moda también coincide.
 La asimetría es positiva o negativa
en función de a qué lado se
encuentra la cola de la distribución.
 La media tiende a desplazarse
hacia las valores extremos (colas).
No coincide con la mediana. Es un punto donde
el histograma “estaría en equilibrio” si tuviese
masa.
 Las discrepancias entre las
medidas de centralización son
indicación de asimetría.
Estadígrafos para detectar asimetría
 Hay diferentes estadígrafos que sirven para detectar asimetría.
 Basado en diferencia entre estadígrafos de tendencia central.
 Basado en la diferencia entre el 1º y 2º cuartiles y 2º y 3º.
 Basados en desviaciones con signo al cubo con respecto a la media.
 Son calculados con computador. Es pesado de hacer a mano.
 En función del signo del estadígrafo diremos que la asimetría es positiva o
negativa.
 Distribución simétrica  asimetría nula.
x
8 10 12 14 16 18 20
0.00
0.05
0.10
0.15
0.20
8 10 12 14 16 18 20
x s
78 %
x
-2 -1 0 1 2 3
0.0
0.1
0.2
0.3
0.4
0.5
-2 -1 0 1 2 3
x s
66 %
x
0 2 4 6 8 10 12 14
0.00
0.05
0.10
0.15
0.20
0 2 4 6 8 10 12 14
x s
78 %
Apuntamiento o curtosis
La curtosis nos indica el grado de apuntamiento (aplastamiento) de una
distribución con respecto a la distribución normal o gaussiana. Es
adimensional.
Platicúrtica (aplanada): curtosis < 0
Mesocúrtica (como la normal): curtosis = 0
Leptocúrtica (apuntada): curtosis > 0
Apuntada como la normal
-3 -2 -1 0 1 2 3
0.0
0.1
0.2
0.3
-3 -2 -1 0 1 2 3
x s
68 %
Aplanada
0.0 0.2 0.4 0.6 0.8 1.0
0.0
0.5
1.0
1.5
2.0
0.0 0.2 0.4 0.6 0.8 1.0
x s
57 %
Apuntada
-2 -1 0 1 2
0.0
0.2
0.4
0.6
0.8
-2 -1 0 1 2
x s
82 %
En el curso serán de especial
interés las mesocúrticas y
simétricas (parecidas a la normal).
¿Qué hemos visto?
 Parámetros
 Estadígrafos y estimadores
 Clasificación
 Posición (cuantiles, percentiles,...)
 Diagramas de cajas o tukey
 Medidas de centralización: Media, mediana y moda
 Diferenciar sus propiedades.
 Medidas de dispersión
 con unidades: rango, rango intercuartílico, varianza, desv. típica
 sin unidades: coeficiente de variación
 ¿Qué usamos para comparar dispersión de dos poblaciones?
 Asimetría
 positiva
 negativa
 ¿Podemos observar asimetría sin mirar la gráfica?
 ¿Cómo me gustan los datos?
 Medidas de apuntamiento (curtosis)
 ¿Cómo me gustan los datos?
Muchas Gracias

Más contenido relacionado

La actualidad más candente

Medidas de tendencia central
Medidas de tendencia centralMedidas de tendencia central
Medidas de tendencia centralkelvinceballos13
 
Coeficiente de corelacio de pearson y spearman
Coeficiente de corelacio de pearson y spearmanCoeficiente de corelacio de pearson y spearman
Coeficiente de corelacio de pearson y spearmanYendry Lopez
 
Medidas de posición
Medidas de posiciónMedidas de posición
Medidas de posiciónCelia Pérez
 
Conceptos Básicos de la Estadística
Conceptos Básicos de la EstadísticaConceptos Básicos de la Estadística
Conceptos Básicos de la Estadísticahectorquintero
 
estadística descriptiva e inferencial
estadística descriptiva e inferencialestadística descriptiva e inferencial
estadística descriptiva e inferencialKarlaDanielaOrtega
 
TABLA DE FRECUENCIAS - VARIABLE CUANTITATIVAS
TABLA DE FRECUENCIAS - VARIABLE CUANTITATIVAS TABLA DE FRECUENCIAS - VARIABLE CUANTITATIVAS
TABLA DE FRECUENCIAS - VARIABLE CUANTITATIVAS Juan Carlos Durand
 
Estadistica descriptiva
Estadistica descriptivaEstadistica descriptiva
Estadistica descriptivahilzap
 
Estadistica expo histograma, poligono de frecuencia, ojiva, diagrama de sec...
Estadistica   expo histograma, poligono de frecuencia, ojiva, diagrama de sec...Estadistica   expo histograma, poligono de frecuencia, ojiva, diagrama de sec...
Estadistica expo histograma, poligono de frecuencia, ojiva, diagrama de sec...Jorge Molina
 
Coeficiente de correlacion de pearson
Coeficiente de correlacion de pearsonCoeficiente de correlacion de pearson
Coeficiente de correlacion de pearsonluis gonzalez
 
MEDIDAS DE DISPERSION ABSOLUTAS Y RELATIVAS
MEDIDAS DE DISPERSION ABSOLUTAS Y RELATIVASMEDIDAS DE DISPERSION ABSOLUTAS Y RELATIVAS
MEDIDAS DE DISPERSION ABSOLUTAS Y RELATIVASMEREDY PANCCA APAZA
 
Estadística descriptiva e inferencial
Estadística descriptiva e inferencialEstadística descriptiva e inferencial
Estadística descriptiva e inferencialPedro López Eiroá
 

La actualidad más candente (20)

17.regresión y correlación simple
17.regresión y correlación simple17.regresión y correlación simple
17.regresión y correlación simple
 
Medidas de tendencia central
Medidas de tendencia centralMedidas de tendencia central
Medidas de tendencia central
 
Coeficiente de corelacio de pearson y spearman
Coeficiente de corelacio de pearson y spearmanCoeficiente de corelacio de pearson y spearman
Coeficiente de corelacio de pearson y spearman
 
Medidas de posición
Medidas de posiciónMedidas de posición
Medidas de posición
 
Medidas de Dispersión
Medidas de DispersiónMedidas de Dispersión
Medidas de Dispersión
 
Conceptos Básicos de la Estadística
Conceptos Básicos de la EstadísticaConceptos Básicos de la Estadística
Conceptos Básicos de la Estadística
 
estadística descriptiva e inferencial
estadística descriptiva e inferencialestadística descriptiva e inferencial
estadística descriptiva e inferencial
 
Regresion lineal multiple
Regresion lineal multipleRegresion lineal multiple
Regresion lineal multiple
 
TABLA DE FRECUENCIAS - VARIABLE CUANTITATIVAS
TABLA DE FRECUENCIAS - VARIABLE CUANTITATIVAS TABLA DE FRECUENCIAS - VARIABLE CUANTITATIVAS
TABLA DE FRECUENCIAS - VARIABLE CUANTITATIVAS
 
Medidas de dispersion
Medidas de dispersionMedidas de dispersion
Medidas de dispersion
 
18. Regresión Lineal
18. Regresión Lineal18. Regresión Lineal
18. Regresión Lineal
 
Estadistica descriptiva
Estadistica descriptivaEstadistica descriptiva
Estadistica descriptiva
 
Estadistica expo histograma, poligono de frecuencia, ojiva, diagrama de sec...
Estadistica   expo histograma, poligono de frecuencia, ojiva, diagrama de sec...Estadistica   expo histograma, poligono de frecuencia, ojiva, diagrama de sec...
Estadistica expo histograma, poligono de frecuencia, ojiva, diagrama de sec...
 
Medidas de tendencia central
Medidas de tendencia centralMedidas de tendencia central
Medidas de tendencia central
 
Operacionalización de variables estadistica
Operacionalización de variables estadisticaOperacionalización de variables estadistica
Operacionalización de variables estadistica
 
Coeficiente de correlacion de pearson
Coeficiente de correlacion de pearsonCoeficiente de correlacion de pearson
Coeficiente de correlacion de pearson
 
MEDIDAS DE DISPERSION ABSOLUTAS Y RELATIVAS
MEDIDAS DE DISPERSION ABSOLUTAS Y RELATIVASMEDIDAS DE DISPERSION ABSOLUTAS Y RELATIVAS
MEDIDAS DE DISPERSION ABSOLUTAS Y RELATIVAS
 
Estadística descriptiva e inferencial
Estadística descriptiva e inferencialEstadística descriptiva e inferencial
Estadística descriptiva e inferencial
 
5. regresión lineal multiple
5.  regresión lineal multiple5.  regresión lineal multiple
5. regresión lineal multiple
 
Variables Estadisticas
Variables EstadisticasVariables Estadisticas
Variables Estadisticas
 

Destacado

Estadigrafos dispersion
Estadigrafos dispersionEstadigrafos dispersion
Estadigrafos dispersionpatriciax
 
Coeficiente de Correlación de Pearson y Spearman
Coeficiente de Correlación de Pearson y SpearmanCoeficiente de Correlación de Pearson y Spearman
Coeficiente de Correlación de Pearson y SpearmanPatricia Castillo
 
Estadística: Conceptos básicos
Estadística: Conceptos básicosEstadística: Conceptos básicos
Estadística: Conceptos básicosYris Bettiana
 

Destacado (7)

Estadígrafos
EstadígrafosEstadígrafos
Estadígrafos
 
Estadigrafos dispersion
Estadigrafos dispersionEstadigrafos dispersion
Estadigrafos dispersion
 
Estadigrafos
EstadigrafosEstadigrafos
Estadigrafos
 
Estadígrafos 3
Estadígrafos 3Estadígrafos 3
Estadígrafos 3
 
Estadígrafos de dispersión
Estadígrafos de dispersiónEstadígrafos de dispersión
Estadígrafos de dispersión
 
Coeficiente de Correlación de Pearson y Spearman
Coeficiente de Correlación de Pearson y SpearmanCoeficiente de Correlación de Pearson y Spearman
Coeficiente de Correlación de Pearson y Spearman
 
Estadística: Conceptos básicos
Estadística: Conceptos básicosEstadística: Conceptos básicos
Estadística: Conceptos básicos
 

Similar a Estadigrafos centrales y de dispersion

Similar a Estadigrafos centrales y de dispersion (20)

Estadisticos 29 3-2020
Estadisticos 29 3-2020Estadisticos 29 3-2020
Estadisticos 29 3-2020
 
9 estadistica uma 02.ppt
9 estadistica uma 02.ppt9 estadistica uma 02.ppt
9 estadistica uma 02.ppt
 
3eso estadística 02
3eso estadística 023eso estadística 02
3eso estadística 02
 
Blog pp nivel2
Blog pp nivel2Blog pp nivel2
Blog pp nivel2
 
EstadíStica Nº 04 Medidas Estadisticas
EstadíStica Nº 04 Medidas EstadisticasEstadíStica Nº 04 Medidas Estadisticas
EstadíStica Nº 04 Medidas Estadisticas
 
3.1 medidas de tendencia central y dispersion
3.1 medidas de tendencia central y dispersion3.1 medidas de tendencia central y dispersion
3.1 medidas de tendencia central y dispersion
 
Estadisticos
EstadisticosEstadisticos
Estadisticos
 
Estadistica descriptiva
Estadistica descriptivaEstadistica descriptiva
Estadistica descriptiva
 
Estadisticos 1
Estadisticos 1Estadisticos 1
Estadisticos 1
 
estadistica_Descriptiva.doc
estadistica_Descriptiva.docestadistica_Descriptiva.doc
estadistica_Descriptiva.doc
 
Estadistica descriptiva 2
Estadistica descriptiva 2 Estadistica descriptiva 2
Estadistica descriptiva 2
 
Estadística descriptiva
Estadística descriptivaEstadística descriptiva
Estadística descriptiva
 
1.4. medidas de dispersion
1.4. medidas de dispersion1.4. medidas de dispersion
1.4. medidas de dispersion
 
Medidas de la forma de distribución
Medidas de la forma de distribuciónMedidas de la forma de distribución
Medidas de la forma de distribución
 
Medidas de la_forma_de_distribuciã³n
Medidas de la_forma_de_distribuciã³nMedidas de la_forma_de_distribuciã³n
Medidas de la_forma_de_distribuciã³n
 
Unidad 3
Unidad 3Unidad 3
Unidad 3
 
Unidad 3
Unidad 3Unidad 3
Unidad 3
 
ESTADÍSTICA Y MUESTREO
ESTADÍSTICA Y MUESTREOESTADÍSTICA Y MUESTREO
ESTADÍSTICA Y MUESTREO
 
Análisis de datosdsdsa
Análisis de datosdsdsaAnálisis de datosdsdsa
Análisis de datosdsdsa
 
Bioestadística. Lic. Henry Andrade
Bioestadística. Lic. Henry AndradeBioestadística. Lic. Henry Andrade
Bioestadística. Lic. Henry Andrade
 

Más de Yerko Bravo

Control de Calidad en el Laboratorio.ppt
Control de Calidad en el Laboratorio.pptControl de Calidad en el Laboratorio.ppt
Control de Calidad en el Laboratorio.pptYerko Bravo
 
Diplomado U Andes Gestión de Calidad.pdf
Diplomado U Andes Gestión de Calidad.pdfDiplomado U Andes Gestión de Calidad.pdf
Diplomado U Andes Gestión de Calidad.pdfYerko Bravo
 
ep-15-a3-veracidad-pdf_compress.pdf
ep-15-a3-veracidad-pdf_compress.pdfep-15-a3-veracidad-pdf_compress.pdf
ep-15-a3-veracidad-pdf_compress.pdfYerko Bravo
 
Diagrama de Ishikawa.pptx
Diagrama de Ishikawa.pptxDiagrama de Ishikawa.pptx
Diagrama de Ishikawa.pptxYerko Bravo
 
Histogramas de frecuencia.pdf
Histogramas de frecuencia.pdfHistogramas de frecuencia.pdf
Histogramas de frecuencia.pdfYerko Bravo
 
Bioestadísticas
BioestadísticasBioestadísticas
BioestadísticasYerko Bravo
 
Ambito Nº 8 INS Seguridad de las Instalaciones
Ambito Nº 8 INS Seguridad de las InstalacionesAmbito Nº 8 INS Seguridad de las Instalaciones
Ambito Nº 8 INS Seguridad de las InstalacionesYerko Bravo
 
Normas ISO (16/9)
Normas ISO (16/9)Normas ISO (16/9)
Normas ISO (16/9)Yerko Bravo
 
Ambito 6 REG Gestión de Registros
Ambito 6 REG Gestión de RegistrosAmbito 6 REG Gestión de Registros
Ambito 6 REG Gestión de RegistrosYerko Bravo
 
Ambito 5 RH Recursos Humanos
Ambito 5 RH Recursos HumanosAmbito 5 RH Recursos Humanos
Ambito 5 RH Recursos HumanosYerko Bravo
 
Ambito 4 aoc acceso oportunidad y continuidad
Ambito 4 aoc acceso oportunidad y continuidadAmbito 4 aoc acceso oportunidad y continuidad
Ambito 4 aoc acceso oportunidad y continuidadYerko Bravo
 
Ambito 3 GP Gestión de Procesos
Ambito 3 GP Gestión de ProcesosAmbito 3 GP Gestión de Procesos
Ambito 3 GP Gestión de ProcesosYerko Bravo
 
Ambito 2 CAL Gestión de Calidad
Ambito 2 CAL Gestión de CalidadAmbito 2 CAL Gestión de Calidad
Ambito 2 CAL Gestión de CalidadYerko Bravo
 
Ambito 1 Dignidad del Paciente
Ambito 1 Dignidad del PacienteAmbito 1 Dignidad del Paciente
Ambito 1 Dignidad del PacienteYerko Bravo
 
Citas Automaticas y Gestionadas con Mendeley y Word
Citas Automaticas y Gestionadas con Mendeley y WordCitas Automaticas y Gestionadas con Mendeley y Word
Citas Automaticas y Gestionadas con Mendeley y WordYerko Bravo
 
Manual de Estandar de Calidad Chileno
Manual de Estandar de Calidad ChilenoManual de Estandar de Calidad Chileno
Manual de Estandar de Calidad ChilenoYerko Bravo
 
Normas Especificas de Laboratorio
Normas Especificas de LaboratorioNormas Especificas de Laboratorio
Normas Especificas de LaboratorioYerko Bravo
 

Más de Yerko Bravo (20)

Control de Calidad en el Laboratorio.ppt
Control de Calidad en el Laboratorio.pptControl de Calidad en el Laboratorio.ppt
Control de Calidad en el Laboratorio.ppt
 
Diplomado U Andes Gestión de Calidad.pdf
Diplomado U Andes Gestión de Calidad.pdfDiplomado U Andes Gestión de Calidad.pdf
Diplomado U Andes Gestión de Calidad.pdf
 
3750.pdf
3750.pdf3750.pdf
3750.pdf
 
ep-15-a3-veracidad-pdf_compress.pdf
ep-15-a3-veracidad-pdf_compress.pdfep-15-a3-veracidad-pdf_compress.pdf
ep-15-a3-veracidad-pdf_compress.pdf
 
PEEC.pdf
PEEC.pdfPEEC.pdf
PEEC.pdf
 
Diagrama de Ishikawa.pptx
Diagrama de Ishikawa.pptxDiagrama de Ishikawa.pptx
Diagrama de Ishikawa.pptx
 
SCRUM
SCRUMSCRUM
SCRUM
 
Histogramas de frecuencia.pdf
Histogramas de frecuencia.pdfHistogramas de frecuencia.pdf
Histogramas de frecuencia.pdf
 
Bioestadísticas
BioestadísticasBioestadísticas
Bioestadísticas
 
Ambito Nº 8 INS Seguridad de las Instalaciones
Ambito Nº 8 INS Seguridad de las InstalacionesAmbito Nº 8 INS Seguridad de las Instalaciones
Ambito Nº 8 INS Seguridad de las Instalaciones
 
Normas ISO (16/9)
Normas ISO (16/9)Normas ISO (16/9)
Normas ISO (16/9)
 
Ambito 6 REG Gestión de Registros
Ambito 6 REG Gestión de RegistrosAmbito 6 REG Gestión de Registros
Ambito 6 REG Gestión de Registros
 
Ambito 5 RH Recursos Humanos
Ambito 5 RH Recursos HumanosAmbito 5 RH Recursos Humanos
Ambito 5 RH Recursos Humanos
 
Ambito 4 aoc acceso oportunidad y continuidad
Ambito 4 aoc acceso oportunidad y continuidadAmbito 4 aoc acceso oportunidad y continuidad
Ambito 4 aoc acceso oportunidad y continuidad
 
Ambito 3 GP Gestión de Procesos
Ambito 3 GP Gestión de ProcesosAmbito 3 GP Gestión de Procesos
Ambito 3 GP Gestión de Procesos
 
Ambito 2 CAL Gestión de Calidad
Ambito 2 CAL Gestión de CalidadAmbito 2 CAL Gestión de Calidad
Ambito 2 CAL Gestión de Calidad
 
Ambito 1 Dignidad del Paciente
Ambito 1 Dignidad del PacienteAmbito 1 Dignidad del Paciente
Ambito 1 Dignidad del Paciente
 
Citas Automaticas y Gestionadas con Mendeley y Word
Citas Automaticas y Gestionadas con Mendeley y WordCitas Automaticas y Gestionadas con Mendeley y Word
Citas Automaticas y Gestionadas con Mendeley y Word
 
Manual de Estandar de Calidad Chileno
Manual de Estandar de Calidad ChilenoManual de Estandar de Calidad Chileno
Manual de Estandar de Calidad Chileno
 
Normas Especificas de Laboratorio
Normas Especificas de LaboratorioNormas Especificas de Laboratorio
Normas Especificas de Laboratorio
 

Estadigrafos centrales y de dispersion

  • 2. Parámetros y estadígrafo  Parámetro: Es una cantidad numérica calculada sobre una población  La altura media de los individuos de un país  La idea es resumir toda la información que hay en la población en unos pocos números (parámetros).  Estadígrafo: Ídem (cambiar población por muestra)  La altura media de los que estamos en este aula.  Somos una muestra (¿representativa?) de la población.  Si un estadígrafo se usa para aproximar un parámetro también se le suele llamar estimador. Normalmente nos interesa conocer un parámetro, pero por la dificultad que conlleva estudiar a *TODA* la población, calculamos un estimador sobre una muestra y “confiamos” en que sean próximos. Más adelante veremos como elegir muestras para que el error sea “confiablemente” pequeño.
  • 3.
  • 4.  Posición  Dividen un conjunto ordenado de datos en grupos con la misma cantidad de individuos.  Cuantiles, percentiles, cuartiles,...  Centralización  Indican valores con respecto a los que los datos parecen agruparse.  Media, mediana y moda  Dispersión  Indican la mayor o menor concentración de los datos con respecto a las medidas de centralización.  Desviación típica, coeficiente de variación, rango, varianza  Forma  Asimetría  Apuntamiento o curtosis
  • 5. Estadígrafos de posición  Se define el cuantil de orden a como un valor de la variable por debajo del cual se encuentra una frecuencia acumulada a.  Casos particulares son los percentiles, cuartiles, deciles, quintiles,...
  • 6. Estadígrafos de posición Percentil de orden k = cuantil de orden k/100  Valor tal que al menos p por ciento de los datos son menores que o igual a ese valor y (100-p) por ciento de los datos son mayores que o iguales a ese valor.  La mediana es el percentil 50  El percentil de orden 15 deja por debajo al 15% de las observaciones. Por encima queda el 85% Cuartiles: Dividen a la muestra en 4 grupos con frecuencias similares.  Primer cuartil = Percentil 25 = Cuantil 0,25  Segundo cuartil = Percentil 50 = Cuantil 0,5 = mediana  Tercer cuartil = Percentil 75 = cuantil 0,75
  • 7. Ejemplos  El 5% de los recién nacidos tiene un peso demasiado bajo. ¿Qué peso se considera “demasiado bajo”?  Percentil 5 o cuantil 0,05 Percentil 5 del peso Peso al nacer (Kg) de 100 niños frecuencia 1 2 3 4 5 0 5 10 15 20 25
  • 8. ¿Qué peso es superado sólo por el 25% de los individuos?  Percentil 75 o tercer cuartil Percentil 75 del peso Peso (Kg) de 100 deportistas frecuencia 50 55 60 65 70 75 80 85 0 5 10 15 20 25 30 Ejemplos
  • 9.  El colesterol se distribuye simétricamente en la población. Supongamos que se consideran patológicos los valores extremos. El 90% de los individuos son normales ¿Entre qué valores se encuentran los individuos normales? Percentiles 5 y 95 Colesterol en 100 personas frecuencia 180 200 220 240 260 0 5 10 15 20 Ejemplos
  • 10.  ¿Entre qué valores se encuentran la mitad de los individuos “más normales” de una población en cuanto a altura?  Entre el cuartil 1º y 3º Percentiles 25 y 75 Altura (cm) en 100 varones frecuencia 150 160 170 180 190 0 5 10 15 20 Ejemplos
  • 11. Estadígrafos de centralización Añaden unos cuantos casos particulares a las medidas de posición. En este caso son medidas que buscan posiciones (valores) con respecto a los cuales los datos muestran tendencia a agruparse.  Media (‘mean’) Es la media aritmética (promedio) de los valores de una variable. Suma de los valores dividido por el tamaño muestral.  Media de 2,2,3,7 es (2+2+3+7)/4=3,5  Conveniente cuando los datos se concentran simétricamente con respecto a ese valor. Muy sensible a valores extremos.  Centro de gravedad de los datos  Mediana (‘median’) Es un valor que divide a las observaciones en dos grupos con el mismo número de individuos (percentil 50). Si el número de datos es par, se elige la media de los dos datos centrales.  Mediana de 1,2,4,5,6,6,8 es 5  Mediana de 1,2,4,5,6,6,8,9 es (5+6)/2=5,5  Es conveniente cuando los datos son asimétricos. No es sensible a valores extremos.  Mediana de 1,2,4,5,6,6,800 es 5. ¡La media es 117,7!  Moda (‘mode’) Es el/los valor/es donde la distribución de frecuencia alcanza un máximo.
  • 13. Algunas fórmulas  Datos sin agrupar: x1, x2, ..., xn  ejemplo promedio.jpg  Datos organizados en tabla  si está considerado la frecuencia, esta se debe tomar en cuenta a la hora de considerar el valor de i.  Media n x x i i   Variable fr. fr. ac. L0 – L1 x1 n1 N1 L1 – L2 x2 n2 N2 ... Lk-1 – Lk xk nk Nk n n f x x i i i  
  • 14. Algunas fórmulas-fórmula práctica de percentiles  Datos ordenados: x1, x2, ..., xn  Percentiles Ordenar los datos de menor a mayor. Calcular (p/100)*n Si (p/100)*n es un entero, promediar el valor de la observación ordenada y el siguiente valor mayor en la lista ordenada de los datos. Si (p/100)*n no es un entero, seleccionar la próxima observación mayor en la lista ordenada de los datos.
  • 15. Algunas fórmulas-fórmula práctica de percentiles Ejemplo: Número de organismos coliformes/ml de leche en siete muestras. 5, 8, 6, 7, 8, 2, 3 Lista ordenada: 2, 3, 5, 6, 7, 8, 8  n = 7; p = 50 (50/100)*7 = 3.5, escoja el cuarto de la lista 2, 3, 5, 6, 7, 8, 8  n = 7; p = 25 (25/100)*7 = 1.75, escoja el segundo de la lista 2, 3, 5, 6, 7, 8, 8
  • 16. Diagramas de Tukey  Resumen con 5 números:  Mínimo, cuartiles y máximo.  Suelen dar una buena idea de la distribución.  La zona central, ‘caja’, contiene al 50% central de las observaciones.  Su tamaño se llama ‘rango intercuartílico’ (R.I.)  Es costumbre que ‘los bigotes’, no lleguen hasta los extremos, sino hasta las observaciones que se separan de la caja en no más de 1,5 R.I.  Más allá de esa distancia se consideran anómalas, y así se marcan. Diagrama de cajas de Tukey: Resumen en 5 números Velocidad (Km/h) de 200 vehículos en ciudad densidad 40 45 50 55 60 65 0.00 0.02 0.04 0.06 0.08 40 45 50 55 60 65 Mín. P25 P50 P75 Máx. Diagrama de cajas de Tukey: Resumen en 5 números Velocidad (Km/h) de 200 vehículos en autovía densidad 80 90 100 110 120 130 140 0.00 0.01 0.02 0.03 0.04 80 90 100 110 120 130 140 Mín. P25 P50 P75 Máx.
  • 17. Diagrama de Tukey o Boxplot Dato menor no atípico Mediana Dato mayor no atípico Box-and-Whisker Plot Altura 150 160 170 180 190 200 Dato atípico Q1 Q3 Media Dato atípico
  • 18. Variabilidad o dispersión  Los estudiantes de Bioestadística reciben diferentes calificaciones en la asignatura (variabilidad). ¿A qué puede deberse?  Diferencias individuales en el conocimiento de la materia.  ¿Podría haber otras razones (fuentes de variabilidad)?  Por ejemplo supongamos que todos los alumnos poseen el mismo nivel de conocimiento. ¿Las notas serían las mismas en todos? Seguramente No.  Dormir poco el día del examen, el pan con queso estaba envenenado...  Diferencias individuales en la habilidad para hacer un examen.  El examen no es una medida perfecta del conocimiento.  Variabilidad por error de medida.  En alguna pregunta difícil, se duda entre varias opciones, y al azar se elige la mala  Variabilidad por azar, aleatoriedad.
  • 19. Medidas de dispersión Miden el grado de dispersión (variabilidad) de los datos, independientemente de su causa.  Amplitud o Rango (‘range’): Diferencia entre observaciónes extremas.  2,1,4,3,8,4. El rango es 8-1=7  Es muy sensible a los valores extremos.  Rango intercuartílico (‘interquartile range’):  Es la distancia entre primer y tercer cuartil.  Rango intercuartílico = P75 - P25  Parecida al rango, pero eliminando las observaciones más extremas inferiores y superiores.  No es tan sensible a valores extremos. 150 160 170 180 190 0.00 0.01 0.02 0.03 0.04 0.05 150 160 170 180 190 25% 25% 25% 25% Mín. P25 P50 P75 Máx. Rango intercuartílico Rango
  • 20. Varianza S2 (‘Variance’): Mide el promedio de las desviaciones (al cuadrado) de las observaciones con respecto a la media.  Es sensible a valores extremos (alejados de la media).  Sus unidades son el cuadrado de las de la variable. De interpretación difícil para un principiante.  Cálculo tradicional
  • 21. Varianza S2 (‘Variance’): Existe una expresión que es mas sencilla de realizar. Donde SS es la suma de cuadrados: SS =  xi 2 – (xi) 2/ n “Machine formula”
  • 22. Desviación típica (‘standard deviation’) Es la raíz cuadrada de la varianza  Tiene las misma dimensionalidad (unidades) que la variable. Versión ‘estética’ de la varianza.  Cierta distribución que veremos más adelante (normal o gaussiana) quedará completamente determinada por la media y la desviación típica.  A una distancia de una desv. típica de la media hay ‘más de la mitad’.  A una distancia de dos desv. típica de la media las tendremos casi todas. Peso recién nacidos en partos gemelares 3.300 2.900 2.500 2.100 1.700 1.300 900 500 50 40 30 20 10 0 Desv. típ. = 568,43 Media = 2023 N = 407,00
  • 23. Dispersión en distribuciones ‘normales’ 150 160 170 180 190 0.00 0.01 0.02 0.03 0.04 0.05 x s 68.5 % 150 160 170 180 190 0.00 0.01 0.02 0.03 0.04 0.05 x 2s 95 % Centrado en la media y a una desv. típica de distancia hay aproximadamente el 68% de las observaciones. A dos desviaciones típicas tenemos el 95% (aprox.)
  • 24. Coeficiente de variación Es la razón entre la desviación típica y la media.  Mide la desviación típica en forma de “qué tamaño tiene con respecto a la media”  También se la denomina variabilidad relativa.  Es frecuente mostrarla en porcentajes  Si la media es 80 y la desviación típica 20 entonces CV=20/80=0,25=25% (variabilidad relativa)  Es una cantidad adimensional. Interesante para comparar la variabilidad de diferentes variables.  Si el peso tiene CV=30% y la altura tiene CV=10%, los individuos presentan más dispersión en peso que en altura.  No debe usarse cuando la variable presenta valores negativos o donde el valor 0 sea una cantidad fijada arbitrariamente  Por ejemplo 0ºC ≠ 0ºF
  • 25. Asimetría o Sesgo  Una distribución es simétrica si la mitad izquierda de su distribución es la imagen espejo de su mitad derecha.  En las distribuciones simétricas media y mediana coinciden. Si sólo hay una moda también coincide.  La asimetría es positiva o negativa en función de a qué lado se encuentra la cola de la distribución.  La media tiende a desplazarse hacia las valores extremos (colas). No coincide con la mediana. Es un punto donde el histograma “estaría en equilibrio” si tuviese masa.  Las discrepancias entre las medidas de centralización son indicación de asimetría.
  • 26. Estadígrafos para detectar asimetría  Hay diferentes estadígrafos que sirven para detectar asimetría.  Basado en diferencia entre estadígrafos de tendencia central.  Basado en la diferencia entre el 1º y 2º cuartiles y 2º y 3º.  Basados en desviaciones con signo al cubo con respecto a la media.  Son calculados con computador. Es pesado de hacer a mano.  En función del signo del estadígrafo diremos que la asimetría es positiva o negativa.  Distribución simétrica  asimetría nula. x 8 10 12 14 16 18 20 0.00 0.05 0.10 0.15 0.20 8 10 12 14 16 18 20 x s 78 % x -2 -1 0 1 2 3 0.0 0.1 0.2 0.3 0.4 0.5 -2 -1 0 1 2 3 x s 66 % x 0 2 4 6 8 10 12 14 0.00 0.05 0.10 0.15 0.20 0 2 4 6 8 10 12 14 x s 78 %
  • 27. Apuntamiento o curtosis La curtosis nos indica el grado de apuntamiento (aplastamiento) de una distribución con respecto a la distribución normal o gaussiana. Es adimensional. Platicúrtica (aplanada): curtosis < 0 Mesocúrtica (como la normal): curtosis = 0 Leptocúrtica (apuntada): curtosis > 0 Apuntada como la normal -3 -2 -1 0 1 2 3 0.0 0.1 0.2 0.3 -3 -2 -1 0 1 2 3 x s 68 % Aplanada 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.5 1.0 1.5 2.0 0.0 0.2 0.4 0.6 0.8 1.0 x s 57 % Apuntada -2 -1 0 1 2 0.0 0.2 0.4 0.6 0.8 -2 -1 0 1 2 x s 82 % En el curso serán de especial interés las mesocúrticas y simétricas (parecidas a la normal).
  • 28. ¿Qué hemos visto?  Parámetros  Estadígrafos y estimadores  Clasificación  Posición (cuantiles, percentiles,...)  Diagramas de cajas o tukey  Medidas de centralización: Media, mediana y moda  Diferenciar sus propiedades.  Medidas de dispersión  con unidades: rango, rango intercuartílico, varianza, desv. típica  sin unidades: coeficiente de variación  ¿Qué usamos para comparar dispersión de dos poblaciones?  Asimetría  positiva  negativa  ¿Podemos observar asimetría sin mirar la gráfica?  ¿Cómo me gustan los datos?  Medidas de apuntamiento (curtosis)  ¿Cómo me gustan los datos?