SlideShare una empresa de Scribd logo
1 de 29
Bioestadística. U. Málaga. Tema 2: Estadísticos 1
Bioestadística
Tema 2: Estadísticos
Tema 2: Estadísticos 2Bioestadística. U. Málaga.
Parámetros y estadísticos
 Parámetro: Es una cantidad numérica calculada sobre una
población
 La altura media de los individuos de un país
 La idea es resumir toda la información que hay en la población en
unos pocos números (parámetros).
 Estadístico: Ídem (cambiar población por muestra)
 La altura media de los que estamos en este aula.
 Somos una muestra (¿representativa?) de la población.
 Si un estadístico se usa para aproximar un parámetro también se le
suele llamar estimador.
Normalmente nos interesa conocer un parámetro, pero por la dificultad que
conlleva estudiar a *TODA* la población, calculamos un estimador
sobre una muestra y “confiamos” en que sean próximos. Más adelante
veremos como elegir muestras para que el error sea “confiablemente”
pequeño.
Tema 2: Estadísticos 3Bioestadística. U. Málaga.
Tema 2: Estadísticos 4Bioestadística. U. Málaga.
Un brevísimo resumen sobre estadísticos
 Posición
 Dividen un conjunto ordenado de datos en grupos con la
misma cantidad de individuos.
 Cuantiles, percentiles, cuartiles, deciles,...
 Centralización
 Indican valores con respecto a los que los datos
parecen agruparse.
 Media, mediana y moda
 Dispersión
 Indican la mayor o menor concentración de los datos
con respecto a las medidas de centralización.
 Desviación típica, coeficiente de variación, rango, varianza
 Forma
 Asimetría
 Apuntamiento o curtosis
Tema 2: Estadísticos 5Bioestadística. U. Málaga.
Estadísticos de posición
 Se define el cuantil de orden α como un valor de la variable por debajo
del cual se encuentra una frecuencia acumulada α.
 Casos particulares son los percentiles, cuartiles, deciles, quintiles,...
Tema 2: Estadísticos 6Bioestadística. U. Málaga.
Estadísticos de posición
 Percentil de orden k = cuantil de orden k/100
 La mediana es el percentil 50
 El percentil de orden 15 deja por debajo al 15% de las
observaciones. Por encima queda el 85%
 Cuartiles: Dividen a la muestra en 4 grupos con
frecuencias similares.
 Primer cuartil = Percentil 25 = Cuantil 0,25
 Segundo cuartil = Percentil 50 = Cuantil 0,5 = mediana
 Tercer cuartil = Percentil 75 = cuantil 0,75
Tema 2: Estadísticos 7Bioestadística. U. Málaga.
Ejemplos
 El 5% de los recién nacidos tiene un peso demasiado bajo.
¿Qué peso se considera “demasiado bajo”?
 Percentil 5 o cuantil 0,05
Percentil 5 del peso
Peso al nacer (Kg) de 100 niños
frecuencia
1 2 3 4 5
0510152025
Tema 2: Estadísticos 8Bioestadística. U. Málaga.
Ejemplos
¿Qué peso es superado sólo por el 25% de los individuos?
 Percentil 75 o tercer cuartil
Percentil 75 del peso
Peso (Kg) de 100 deportistas
frecuencia
50 55 60 65 70 75 80 85
051015202530
Tema 2: Estadísticos 9Bioestadística. U. Málaga.
Ejemplos
 El colesterol se distribuye simétricamente en la población. Supongamos
que se consideran patológicos los valores extremos. El 90% de los
individuos son normales ¿Entre qué valores se encuentran los individuos
normales?
Percentiles 5 y 95
Colesterol en 100 personas
frecuencia
180 200 220 240 260
05101520
Tema 2: Estadísticos 10Bioestadística. U. Málaga.
Ejemplos
 ¿Entre qué valores se encuentran la mitad de los individuos “más
normales” de una población?
 Entre el cuartil 1º y 3º
Percentiles 25 y 75
Altura (cm) en 100 varones
frecuencia
150 160 170 180 190
05101520
Tema 2: Estadísticos 11Bioestadística. U. Málaga.
Diagramas de Tukey
 Resumen con 5 números:
 Mínimo, cuartiles y máximo.
 Suelen dar una buena idea
de la distribución.
 La zona central, ‘caja’,
contiene al 50% central de
las observaciones.
 Su tamaño se llama ‘rango
intercuartílico’ (R.I.)
 Es costumbre que ‘los
bigotes’, no lleguen hasta los
extremos, sino hasta las
observaciones que se
separan de la caja en no más
de 1,5 R.I.
 Más allá de esa distancia se
consideran anómalas, y así
se marcan.
Diagrama de cajas de Tukey: Resumen en 5 números
Velocidad (Km/h) de 200 vehículos en ciudad
densidad
40 45 50 55 60 65
0.000.020.040.060.08
40 45 50 55 60 65
Mín. P25 P50 P75 Máx.
Diagrama de cajas de Tukey: Resumen en 5 números
Velocidad (Km/h) de 200 vehículos en autovía
densidad
80 90 100 110 120 130 140
0.000.010.020.030.04
80 90 100 110 120 130 140
Mín. P25 P50 P75 Máx.
Tema 2: Estadísticos 12Bioestadística. U. Málaga.
Ejemplo
Número de años de escolarización
5 ,3 ,3
5 ,3 ,7
6 ,4 1,1
12 ,8 1,9
25 1,7 3,5
68 4,5 8,0
56 3,7 11,7
73 4,8 16,6
85 5,6 22,2
461 30,6 52,8
130 8,6 61,4
175 11,6 73,0
73 4,8 77,9
194 12,9 90,7
43 2,9 93,6
45 3,0 96,6
22 1,5 98,0
30 2,0 100,0
1508 100,0
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
Total
Frecuencia Porcentaje
Porcentaje
acumulado
Estadísticos
Número de años de escolarización
1508
0
12,90
12,00
12
9,00
11,00
12,00
12,00
12,00
12,00
13,00
14,00
15,00
16,00
16,00
Válidos
Perdidos
N
Media
Mediana
Moda
10
20
25
30
40
50
60
70
75
80
90
Percentiles
≥20%?
≥ 90%?
Tema 2: Estadísticos 13Bioestadística. U. Málaga.
Estadísticos de centralización
Añaden unos cuantos casos particulares a las medidas de posición. En este caso
son medidas que buscan posiciones (valores) con respecto a los cuales los
datos muestran tendencia a agruparse.
 Media (‘mean’) Es la media aritmética (promedio) de los valores de una
variable. Suma de los valores dividido por el tamaño muestral.
 Media de 2,2,3,7 es (2+2+3+7)/4=3,5
 Conveniente cuando los datos se concentran simétricamente con respecto
a ese valor. Muy sensible a valores extremos.
 Centro de gravedad de los datos
 Mediana (‘median’) Es un valor que divide a las observaciones en dos grupos
con el mismo número de individuos (percentil 50). Si el número de datos es
par, se elige la media de los dos datos centrales.
 Mediana de 1,2,4,5,6,6,8 es 5
 Mediana de 1,2,4,5,6,6,8,9 es (5+6)/2=5,5
 Es conveniente cuando los datos son asimétricos. No es sensible a valores
extremos.
 Mediana de 1,2,4,5,6,6,800 es 5. ¡La media es 117,7!
 Moda (‘mode’) Es el/los valor/es donde la distribución de frecuencia alcanza un
máximo.
Tema 2: Estadísticos 14Bioestadística. U. Málaga.
Altura mediana
Tema 2: Estadísticos 15Bioestadística. U. Málaga.
Algunas fórmulas
 Datos sin agrupar: x1, x2, ..., xn
 Media
 Datos organizados en tabla
 si está en intervalos usar como xi las marcas de
clase. Si no ignorar la columna de intervalos.
 Media
 Cuantil de orden α
 i es el menor intervalo que tiene
frecuencia acumulada superior a α ·n
 α=0,5 es mediana
n
x
x i i∑=
Variable fr. fr. ac.
L0 – L1 x1 n1 N1
L1 – L2 x2 n2 N2
...
Lk-1 – Lk xk nk Nk
n
n
nx
x i ii∑=
)( 1
1
1 −
−
− −
−⋅
+= ii
i
i
i LL
n
Nn
LC
α
α
Tema 2: Estadísticos 16Bioestadística. U. Málaga.
Ejemplo con variable en intervalos
Peso M.
Clase
frec Fr.
acum.
40 – 50 45 5 5
50 – 60 55 10 15
60 – 70 65 21 36
70 - 80 75 11 47
80 - 90 85 5 52
90 - 100 95 3 55
100 – 130 115 3 58
En el histograma se identifica “unidad de área” con
“individuo”.
Para calcular la media es necesario elegir un punto
representante del intervalo: La marca de clase.
La media se desplaza hacia los valores extremos.
No coincide con la mediana. Es un punto donde el
histograma “estaría en equilibrio” si tuviese masa.
Tema 2: Estadísticos 17Bioestadística. U. Málaga.
Ejemplo (continuación)
Peso M. Clase Fr. Fr. ac.
40 – 50 45 5 5
50 – 60 55 10 15
60 – 70 65 21 36
70 - 80 75 11 47
80 - 90 85 5 52
90 - 100 95 3 55
100 – 130 115 3 58
58
 Moda = marca de clase de (60,70] = 65
 Cada libro ofrece una fórmula diferente para la moda (difícil estar al día.)
3,69
58
31151055545
=
⋅++⋅+⋅
==
∑ 
n
nx
x i ii
6,66)6070(
21
15585,0
60
)(
585,0
1
1
15,0

=−
−⋅
+=
−
−⋅
+== −
−
− ii
i
i
i LL
n
N
LCMediana
8,76)7080(
11
365,43
70)(
5875,0
1
1
175,075 =−
−
+=−
−⋅
+== −
−
− ii
i
i
i LL
n
N
LCP
Tema 2: Estadísticos 18Bioestadística. U. Málaga.
Variabilidad o dispersión
 Los estudiantes de Bioestadística reciben diferentes calificaciones en la
asignatura (variabilidad). ¿A qué puede deberse?
 Diferencias individuales en el conocimiento de la materia.
 ¿Podría haber otras razones (fuentes de variabilidad)?
 Por ejemplo supongamos que todos los alumnos poseen el mismo nivel de
conocimiento. ¿Las notas serían las mismas en todos? Seguramente No.
 Dormir poco el día del examen, el croissant estaba envenenado...
 Diferencias individuales en la habilidad para hacer un examen.
 El examen no es una medida perfecta del conocimiento.
 Variabilidad por error de medida.
 En alguna pregunta difícil, se duda entre varias opciones, y al azar se elige
la mala
 Variabilidad por azar, aleatoriedad.
Tema 2: Estadísticos 19Bioestadística. U. Málaga.
Miden el grado de dispersión (variabilidad) de los datos, independientemente
de su causa.
 Amplitud o Rango (‘range’):
Diferencia entre observaciónes extremas.
 2,1,4,3,8,4. El rango es 8-1=7
 Es muy sensible a los valores extremos.
 Rango intercuartílico (‘interquartile range’):
 Es la distancia entre primer y tercer cuartil.
 Rango intercuartílico = P75 - P25
 Parecida al rango, pero eliminando las observaciones más extremas
inferiores y superiores.
 No es tan sensible a valores extremos.
150 160 170 180 190
0.000.010.020.030.040.05
150 160 170 180 190
25% 25% 25% 25%
Mín. P25 P50 P75 Máx.
Rango intercuartílico
Rango
Medidas de dispersión
Tema 2: Estadísticos 20Bioestadística. U. Málaga.
 Varianza S2
(‘Variance’): Mide el promedio de las desviaciones (al cuadrado) de las
observaciones con respecto a la media.
 Es sensible a valores extremos (alejados de la media).
 Sus unidades son el cuadrado de las de la variable. De interpretación difícil para un
principiante.
 La expresión es fea, pero de gran belleza ‘natural’ (físicamente). Contiene la
información geométrica relevante en muchas situaciones donde la energía interna de
un sistema depende de la posición de sus partículas.
 Energía de rotación (vía el coeficiente de inercia): patinadores con brazos extendidos
(dispersos) o recogidos (poco dispersos)
 Energía elástica: Muelles ‘estirados’ con respecto a su posición de equilibrio (dispersos)
frente a muelles en posición cercana a su posición de equilibrio (poco dispersos)
∑ −=
i
i xx
n
S 22
)(
1
Tema 2: Estadísticos 21Bioestadística. U. Málaga.
Desviación típica (‘standard deviation’)
Es la raíz cuadrada de la varianza
 Tiene las misma dimensionalidad
(unidades) que la variable. Versión
‘estética’ de la varianza.
 Cierta distribución que veremos más
adelante (normal o gaussiana)
quedará completamente determinada
por la media y la desviación típica.
 A una distancia de una desv. típica de la
media hay más de la ‘más de la mitad’.
 A una distancia de dos desv. típica de la
media las tendremos casi todas.
2
SS =
Peso recién nacidos en partos gemelares
3.300
2.900
2.500
2.100
1.700
1.300
900
500
50
40
30
20
10
0
Desv. típ. = 568,43
Media = 2023
N = 407,00
Tema 2: Estadísticos 22Bioestadística. U. Málaga.
Dispersión en distribuciones ‘normales’
 Centrado en la media y a una desv. típica de distancia hay
aproximadamente el 68% de las observaciones.
 A dos desviaciones típicas tenemos el 95% (aprox.)
150 160 170 180 190
0.000.010.020.030.040.05
x±s
68.5 %
150 160 170 180 190
0.000.010.020.030.040.05
x± 2s
95 %
Tema 2: Estadísticos 23Bioestadística. U. Málaga.
 Datos ‘casi normales’. Eje ‘x’ medido en desviaciones típicas…
 ¿Encuentras relación entre rango intercuartílico y desviación típica?
 ¿Y entre los ‘bigotes’ y dos desviaciones típicas? ¿Podrías
caracterizar las observaciones anómalas?
-3 -2 -1 0 1 2 3
0.00.10.20.3
densidad
-3 -2 -1 0 1 2 3
x ± s
66 %
x ±2s
95 %
-3 -2 -1 0 1 2 3
0.00.10.20.3
densidad
-3 -2 -1 0 1 2 3
x ±s
71 %
x ± 2s
94 %
-3 -2 -1 0 1 2 3
0.00.10.20.30.4
densidad
-3 -2 -1 0 1 2 3
x ± s
68 %
x ±2s
94 %
-3 -2 -1 0 1 2 3
0.00.10.20.3
densidad
-3 -2 -1 0 1 2 3
x ±s
70 %
x ± 2s
94 %
Tema 2: Estadísticos 24Bioestadística. U. Málaga.
Coeficiente de variación
Es la razón entre la desviación típica y la media.
 Mide la desviación típica en forma de
“qué tamaño tiene con respecto a la media”
 También se la denomina variabilidad relativa.
 Es frecuente mostrarla en porcentajes
 Si la media es 80 y la desviación típica 20 entonces CV=20/80=0,25=25% (variabilidad
relativa)
 Es una cantidad adimensional. Interesante para comparar la variabilidad de
diferentes variables.
 Si el peso tiene CV=30% y la altura tiene CV=10%, los individuos presentan más
dispersión en peso que en altura.
 No debe usarse cuando la variable presenta valores negativos o donde el valor 0
sea una cantidad fijada arbitrariamente
 Por ejemplo 0ºC ≠ 0ºF
 Los ingenieros electrónicos hablan de la razón ‘señal/ruido’ (su inverso).
x
S
CV =
Tema 2: Estadísticos 25Bioestadística. U. Málaga.
Asimetría o Sesgo
 Una distribución es simétrica si la
mitad izquierda de su distribución
es la imagen especular de su mitad
derecha.
 En las distribuciones simétricas
media y mediana coinciden. Si sólo
hay una moda también coincide
 La asimetría es positiva o negativa
en función de a qué lado se
encuentra la cola de la distribución.
 La media tiende a desplazarse
hacia las valores extremos (colas).
 Las discrepancias entre las
medidas de centralización son
indicación de asimetría.
Tema 2: Estadísticos 26Bioestadística. U. Málaga.x
8 10 12 14 16 18 20
0.000.050.100.150.20
8 10 12 14 16 18 20
x ± s
78 %
x
-2 -1 0 1 2 3
0.00.10.20.30.40.5
-2 -1 0 1 2 3
x ± s
66 %
x
0 2 4 6 8 10 12 14
0.000.050.100.150.20
0 2 4 6 8 10 12 14
x ± s
78 %
Estadísticos para detectar asimetría
 Hay diferentes estadísticos que sirven para detectar asimetría.
 Basado en diferencia entre estadísticos de tendencia central.
 Basado en la diferencia entre el 1º y 2º cuartiles y 2º y 3º.
 Basados en desviaciones con signo al cubo con respecto a la media.
 Los calculados con ordenador. Es pesado de hacer a mano.
 En función del signo del estadístico diremos que la asimetría es
positiva o negativa.
 Distribución simétrica  asimetría nula.
Tema 2: Estadísticos 27Bioestadística. U. Málaga.
Apuntamiento o curtosis
En el curso serán de especial
interés las mesocúrticas y
simétricas (parecidas a la normal).
La curtosis nos indica el grado de apuntamiento (aplastamiento) de una
distribución con respecto a la distribución normal o gaussiana. Es
adimensional.
Platicúrtica (aplanada): curtosis < 0
Mesocúrtica (como la normal): curtosis = 0
Leptocúrtica (apuntada): curtosis > 0
Aplanada
0.0 0.2 0.4 0.6 0.8 1.0
0.00.51.01.52.0
0.0 0.2 0.4 0.6 0.8 1.0
x±s
57 %
Apuntada como la normal
-3 -2 -1 0 1 2 3
0.00.10.20.3
-3 -2 -1 0 1 2 3
x± s
68 %
Apuntada
-2 -1 0 1 2
0.00.20.40.60.8
-2 -1 0 1 2
x± s
82 %
Tema 2: Estadísticos 28Bioestadística. U. Málaga.
0 1 2 3 4 5 6 7 Ocho o más
Número de hijos
5%
10%
15%
20%
25%
Porcentaje
n=419
28%
n=255
17%
n=375
25%
n=215
14%
n=127
8%
n=54
4%
n=24
2%
n=23
2%
n=17
1%
Ejercicio: descriptiva con SPSS
Descriptivos para Número de hijos
1,90 ,045
1,81
1,99
1,75
2,00
3,114
1,765
0
8
8
3,00
1,034 ,063
1,060 ,126
Media
Límite
inferior
Límite
superior
Intervalo de
confianza para la
media al 95%
Media recortada al 5%
Mediana
Varianza
Desv. típ.
Mínimo
Máximo
Rango
Amplitud intercuartil
Asimetría
Curtosis
Estadístico Error típ.
 Está sombreado lo que sabemos interpretar hasta ahora.
Verifica que comprendes todo. ¿Qué unidades tiene cada
estadístico? ¿Variabilidad relativa?
 Calcula los estadísticos que puedas basándote sólo en el
gráfico de barras.
Tema 2: Estadísticos 29Bioestadística. U. Málaga.
¿Qué hemos visto?
 Parámetros
 Estadísticos y estimadores
 Clasificación
 Posición (cuantiles, percentiles,...)
 Diagramas de cajas
 Medidas de centralización: Media, mediana y moda
 Diferenciar sus propiedades.
 Medidas de dispersión
 con unidades: rango, rango intercuartílico, varianza, desv.
típica
 sin unidades: coeficiente de variación
 ¿Qué usamos para comparar dispersión de dos poblaciones?
 Asimetría
 positiva
 negativa
 ¿Podemos observar asimetría sin mirar la gráfica?
 ¿Cómo me gustan los datos?
 Medidas de apuntamiento (curtosis)
 ¿Cómo me gustan los datos?

Más contenido relacionado

La actualidad más candente

Statistics
StatisticsStatistics
Statistics
pikuoec
 

La actualidad más candente (20)

Cuartiles
CuartilesCuartiles
Cuartiles
 
Guía de estudio. Distribuciones muestrales
Guía de estudio. Distribuciones muestrales Guía de estudio. Distribuciones muestrales
Guía de estudio. Distribuciones muestrales
 
Basic concepts of statistics
Basic concepts of statistics Basic concepts of statistics
Basic concepts of statistics
 
Modelos mixed
Modelos mixedModelos mixed
Modelos mixed
 
data organization and presentation.pptx
data organization and presentation.pptxdata organization and presentation.pptx
data organization and presentation.pptx
 
Estadistica descriptiva
Estadistica descriptivaEstadistica descriptiva
Estadistica descriptiva
 
Estadística-Presentacion
Estadística-PresentacionEstadística-Presentacion
Estadística-Presentacion
 
Estadistica Descriptiva
Estadistica DescriptivaEstadistica Descriptiva
Estadistica Descriptiva
 
Metodos estadisticos y tabulacion
Metodos estadisticos y tabulacionMetodos estadisticos y tabulacion
Metodos estadisticos y tabulacion
 
Medidas de Tendencia Central
Medidas de Tendencia CentralMedidas de Tendencia Central
Medidas de Tendencia Central
 
Medidas de tendencia central y posición
Medidas de tendencia central y posición Medidas de tendencia central y posición
Medidas de tendencia central y posición
 
Estadística descriptiva
Estadística descriptivaEstadística descriptiva
Estadística descriptiva
 
Prueba no parametrica (kolmogorov - smirnov).pptx
Prueba no parametrica (kolmogorov - smirnov).pptxPrueba no parametrica (kolmogorov - smirnov).pptx
Prueba no parametrica (kolmogorov - smirnov).pptx
 
Qué es estadística
Qué es estadísticaQué es estadística
Qué es estadística
 
Tutorial stata
Tutorial stataTutorial stata
Tutorial stata
 
T de student
T de studentT de student
T de student
 
Estadística: Distribuciones 2
Estadística: Distribuciones 2Estadística: Distribuciones 2
Estadística: Distribuciones 2
 
Statistics
StatisticsStatistics
Statistics
 
Datos no agrupados
Datos no agrupadosDatos no agrupados
Datos no agrupados
 
1.2. DescripcióN De Datos
1.2. DescripcióN De Datos1.2. DescripcióN De Datos
1.2. DescripcióN De Datos
 

Destacado

3º eso tema 1
3º eso tema 13º eso tema 1
3º eso tema 1
rousbell
 
Diapositivas estadistica
Diapositivas estadisticaDiapositivas estadistica
Diapositivas estadistica
lissethperez
 

Destacado (13)

3º eso tema 1
3º eso tema 13º eso tema 1
3º eso tema 1
 
Estadistica 3º ESO
Estadistica 3º ESOEstadistica 3º ESO
Estadistica 3º ESO
 
Estadísticos de orden
Estadísticos de ordenEstadísticos de orden
Estadísticos de orden
 
Avad y avisas ultima
Avad y avisas ultimaAvad y avisas ultima
Avad y avisas ultima
 
Clase02 distribuciones de probabilidad
Clase02   distribuciones de probabilidadClase02   distribuciones de probabilidad
Clase02 distribuciones de probabilidad
 
Bioestadística
BioestadísticaBioestadística
Bioestadística
 
Bioestadistica
Bioestadistica Bioestadistica
Bioestadistica
 
Diapositivas estadistica
Diapositivas estadisticaDiapositivas estadistica
Diapositivas estadistica
 
Bioestadística
BioestadísticaBioestadística
Bioestadística
 
Estadistica en Salud
Estadistica en SaludEstadistica en Salud
Estadistica en Salud
 
Tablas, cuadros y figuras
Tablas, cuadros y figurasTablas, cuadros y figuras
Tablas, cuadros y figuras
 
Bioestadística para enfermeros, generalidades
Bioestadística para enfermeros, generalidadesBioestadística para enfermeros, generalidades
Bioestadística para enfermeros, generalidades
 
Estadística: Conceptos básicos
Estadística: Conceptos básicosEstadística: Conceptos básicos
Estadística: Conceptos básicos
 

Similar a 3eso estadística 02

Estadigrafos centrales y de dispersion
Estadigrafos centrales y de dispersionEstadigrafos centrales y de dispersion
Estadigrafos centrales y de dispersion
Yerko Bravo
 
3.1 medidas de tendencia central y dispersion
3.1 medidas de tendencia central y dispersion3.1 medidas de tendencia central y dispersion
3.1 medidas de tendencia central y dispersion
insucoppt
 
PROBABILIDAD Y ESTADISTICA contenido tematico 4 parciales
PROBABILIDAD Y ESTADISTICA contenido tematico 4 parcialesPROBABILIDAD Y ESTADISTICA contenido tematico 4 parciales
PROBABILIDAD Y ESTADISTICA contenido tematico 4 parciales
Eli Diaz
 
Guia estudio 03.pptxestadistica
Guia estudio 03.pptxestadisticaGuia estudio 03.pptxestadistica
Guia estudio 03.pptxestadistica
cienciascontables
 
Comunidad_Emagister_66885_66885. Medidas de Tendencia Central.pdf
Comunidad_Emagister_66885_66885. Medidas de Tendencia Central.pdfComunidad_Emagister_66885_66885. Medidas de Tendencia Central.pdf
Comunidad_Emagister_66885_66885. Medidas de Tendencia Central.pdf
Carlos Franco
 

Similar a 3eso estadística 02 (20)

9 estadistica uma 02.ppt
9 estadistica uma 02.ppt9 estadistica uma 02.ppt
9 estadistica uma 02.ppt
 
Estadisticos 1
Estadisticos 1Estadisticos 1
Estadisticos 1
 
estadistica_Descriptiva.doc
estadistica_Descriptiva.docestadistica_Descriptiva.doc
estadistica_Descriptiva.doc
 
Estadisticos 29 3-2020
Estadisticos 29 3-2020Estadisticos 29 3-2020
Estadisticos 29 3-2020
 
Estadisticos
EstadisticosEstadisticos
Estadisticos
 
Estadigrafos centrales y de dispersion
Estadigrafos centrales y de dispersionEstadigrafos centrales y de dispersion
Estadigrafos centrales y de dispersion
 
Blog pp nivel2
Blog pp nivel2Blog pp nivel2
Blog pp nivel2
 
20121010141000
2012101014100020121010141000
20121010141000
 
3.1 medidas de tendencia central y dispersion
3.1 medidas de tendencia central y dispersion3.1 medidas de tendencia central y dispersion
3.1 medidas de tendencia central y dispersion
 
Tema 3 Medidas De Posición
Tema 3 Medidas De PosiciónTema 3 Medidas De Posición
Tema 3 Medidas De Posición
 
PROBABILIDAD Y ESTADISTICA contenido tematico 4 parciales
PROBABILIDAD Y ESTADISTICA contenido tematico 4 parcialesPROBABILIDAD Y ESTADISTICA contenido tematico 4 parciales
PROBABILIDAD Y ESTADISTICA contenido tematico 4 parciales
 
ciclo_iv_bioestadistica_clase_4_enfermería
ciclo_iv_bioestadistica_clase_4_enfermeríaciclo_iv_bioestadistica_clase_4_enfermería
ciclo_iv_bioestadistica_clase_4_enfermería
 
ciclo_iv_bioestadistica_clase_4_bioestadística
ciclo_iv_bioestadistica_clase_4_bioestadísticaciclo_iv_bioestadistica_clase_4_bioestadística
ciclo_iv_bioestadistica_clase_4_bioestadística
 
Psico 6ta medidas posición relativa
Psico 6ta  medidas posición relativaPsico 6ta  medidas posición relativa
Psico 6ta medidas posición relativa
 
Listo
ListoListo
Listo
 
Estadistica
Estadistica Estadistica
Estadistica
 
Guia estudio 03.pptxestadistica
Guia estudio 03.pptxestadisticaGuia estudio 03.pptxestadistica
Guia estudio 03.pptxestadistica
 
Mediana 100715195108-phpapp01
Mediana 100715195108-phpapp01Mediana 100715195108-phpapp01
Mediana 100715195108-phpapp01
 
Comunidad_Emagister_66885_66885.pdf
Comunidad_Emagister_66885_66885.pdfComunidad_Emagister_66885_66885.pdf
Comunidad_Emagister_66885_66885.pdf
 
Comunidad_Emagister_66885_66885. Medidas de Tendencia Central.pdf
Comunidad_Emagister_66885_66885. Medidas de Tendencia Central.pdfComunidad_Emagister_66885_66885. Medidas de Tendencia Central.pdf
Comunidad_Emagister_66885_66885. Medidas de Tendencia Central.pdf
 

Más de rinconesfisquiymat

Sistemas de ecuaciones 2º ESO
Sistemas de ecuaciones 2º ESOSistemas de ecuaciones 2º ESO
Sistemas de ecuaciones 2º ESO
rinconesfisquiymat
 

Más de rinconesfisquiymat (20)

Hoja de-calculo con-g_docs
Hoja de-calculo con-g_docsHoja de-calculo con-g_docs
Hoja de-calculo con-g_docs
 
áreas y tipos de polígonos
áreas y tipos de polígonosáreas y tipos de polígonos
áreas y tipos de polígonos
 
Unidades de medida
Unidades de medidaUnidades de medida
Unidades de medida
 
Áreas y tipos de polígonos
Áreas y tipos de polígonosÁreas y tipos de polígonos
Áreas y tipos de polígonos
 
Los cuerpos geométricos
Los cuerpos geométricosLos cuerpos geométricos
Los cuerpos geométricos
 
3esoestad uma 01
3esoestad uma 013esoestad uma 01
3esoestad uma 01
 
Probabilidad 2º ESO
Probabilidad 2º ESOProbabilidad 2º ESO
Probabilidad 2º ESO
 
Estadística 2º ESO
Estadística 2º ESOEstadística 2º ESO
Estadística 2º ESO
 
Funciones 2º ESO
Funciones 2º ESOFunciones 2º ESO
Funciones 2º ESO
 
Ecuaciones
EcuacionesEcuaciones
Ecuaciones
 
Expresiones algebraicas 2º ESO
Expresiones algebraicas 2º ESOExpresiones algebraicas 2º ESO
Expresiones algebraicas 2º ESO
 
Sistemas de ecuaciones 2º ESO
Sistemas de ecuaciones 2º ESOSistemas de ecuaciones 2º ESO
Sistemas de ecuaciones 2º ESO
 
Iniciación a los sistemas 2º ESO
Iniciación a los sistemas 2º ESOIniciación a los sistemas 2º ESO
Iniciación a los sistemas 2º ESO
 
Funciones 1º ESO
Funciones 1º ESO Funciones 1º ESO
Funciones 1º ESO
 
Estadística 1 ESO
Estadística 1 ESOEstadística 1 ESO
Estadística 1 ESO
 
Ecuaciones primer grado 1 eso
Ecuaciones primer grado 1 esoEcuaciones primer grado 1 eso
Ecuaciones primer grado 1 eso
 
Presentación 1 números naturales y jerarquía de operaciones
Presentación 1   números naturales y jerarquía de operacionesPresentación 1   números naturales y jerarquía de operaciones
Presentación 1 números naturales y jerarquía de operaciones
 
Tema03potenciasyraices
Tema03potenciasyraicesTema03potenciasyraices
Tema03potenciasyraices
 
4eso losnumerosreales-
4eso losnumerosreales-4eso losnumerosreales-
4eso losnumerosreales-
 
Glogster2
Glogster2Glogster2
Glogster2
 

Último

PLAN DE REFUERZO ESCOLAR primaria (1).docx
PLAN DE REFUERZO ESCOLAR primaria (1).docxPLAN DE REFUERZO ESCOLAR primaria (1).docx
PLAN DE REFUERZO ESCOLAR primaria (1).docx
lupitavic
 
FORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURA
FORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURAFORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURA
FORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURA
El Fortí
 
La empresa sostenible: Principales Características, Barreras para su Avance y...
La empresa sostenible: Principales Características, Barreras para su Avance y...La empresa sostenible: Principales Características, Barreras para su Avance y...
La empresa sostenible: Principales Características, Barreras para su Avance y...
JonathanCovena1
 

Último (20)

origen y desarrollo del ensayo literario
origen y desarrollo del ensayo literarioorigen y desarrollo del ensayo literario
origen y desarrollo del ensayo literario
 
proyecto de mayo inicial 5 añitos aprender es bueno para tu niño
proyecto de mayo inicial 5 añitos aprender es bueno para tu niñoproyecto de mayo inicial 5 añitos aprender es bueno para tu niño
proyecto de mayo inicial 5 añitos aprender es bueno para tu niño
 
Estrategias de enseñanza-aprendizaje virtual.pptx
Estrategias de enseñanza-aprendizaje virtual.pptxEstrategias de enseñanza-aprendizaje virtual.pptx
Estrategias de enseñanza-aprendizaje virtual.pptx
 
PIAR v 015. 2024 Plan Individual de ajustes razonables
PIAR v 015. 2024 Plan Individual de ajustes razonablesPIAR v 015. 2024 Plan Individual de ajustes razonables
PIAR v 015. 2024 Plan Individual de ajustes razonables
 
Sesión de clase: Fe contra todo pronóstico
Sesión de clase: Fe contra todo pronósticoSesión de clase: Fe contra todo pronóstico
Sesión de clase: Fe contra todo pronóstico
 
actividades comprensión lectora para 3° grado
actividades comprensión lectora para 3° gradoactividades comprensión lectora para 3° grado
actividades comprensión lectora para 3° grado
 
ACERTIJO DE POSICIÓN DE CORREDORES EN LA OLIMPIADA. Por JAVIER SOLIS NOYOLA
ACERTIJO DE POSICIÓN DE CORREDORES EN LA OLIMPIADA. Por JAVIER SOLIS NOYOLAACERTIJO DE POSICIÓN DE CORREDORES EN LA OLIMPIADA. Por JAVIER SOLIS NOYOLA
ACERTIJO DE POSICIÓN DE CORREDORES EN LA OLIMPIADA. Por JAVIER SOLIS NOYOLA
 
plande accion dl aula de innovación pedagogica 2024.pdf
plande accion dl aula de innovación pedagogica 2024.pdfplande accion dl aula de innovación pedagogica 2024.pdf
plande accion dl aula de innovación pedagogica 2024.pdf
 
SEXTO SEGUNDO PERIODO EMPRENDIMIENTO.pptx
SEXTO SEGUNDO PERIODO EMPRENDIMIENTO.pptxSEXTO SEGUNDO PERIODO EMPRENDIMIENTO.pptx
SEXTO SEGUNDO PERIODO EMPRENDIMIENTO.pptx
 
PLAN DE REFUERZO ESCOLAR primaria (1).docx
PLAN DE REFUERZO ESCOLAR primaria (1).docxPLAN DE REFUERZO ESCOLAR primaria (1).docx
PLAN DE REFUERZO ESCOLAR primaria (1).docx
 
FORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURA
FORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURAFORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURA
FORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURA
 
Tema 8.- PROTECCION DE LOS SISTEMAS DE INFORMACIÓN.pdf
Tema 8.- PROTECCION DE LOS SISTEMAS DE INFORMACIÓN.pdfTema 8.- PROTECCION DE LOS SISTEMAS DE INFORMACIÓN.pdf
Tema 8.- PROTECCION DE LOS SISTEMAS DE INFORMACIÓN.pdf
 
Plan Refuerzo Escolar 2024 para estudiantes con necesidades de Aprendizaje en...
Plan Refuerzo Escolar 2024 para estudiantes con necesidades de Aprendizaje en...Plan Refuerzo Escolar 2024 para estudiantes con necesidades de Aprendizaje en...
Plan Refuerzo Escolar 2024 para estudiantes con necesidades de Aprendizaje en...
 
ORGANIZACIÓN SOCIAL INCA EN EL TAHUANTINSUYO.pptx
ORGANIZACIÓN SOCIAL INCA EN EL TAHUANTINSUYO.pptxORGANIZACIÓN SOCIAL INCA EN EL TAHUANTINSUYO.pptx
ORGANIZACIÓN SOCIAL INCA EN EL TAHUANTINSUYO.pptx
 
La empresa sostenible: Principales Características, Barreras para su Avance y...
La empresa sostenible: Principales Características, Barreras para su Avance y...La empresa sostenible: Principales Características, Barreras para su Avance y...
La empresa sostenible: Principales Características, Barreras para su Avance y...
 
Programacion Anual Matemática4 MPG 2024 Ccesa007.pdf
Programacion Anual Matemática4    MPG 2024  Ccesa007.pdfProgramacion Anual Matemática4    MPG 2024  Ccesa007.pdf
Programacion Anual Matemática4 MPG 2024 Ccesa007.pdf
 
MAYO 1 PROYECTO día de la madre el amor más grande
MAYO 1 PROYECTO día de la madre el amor más grandeMAYO 1 PROYECTO día de la madre el amor más grande
MAYO 1 PROYECTO día de la madre el amor más grande
 
Qué es la Inteligencia artificial generativa
Qué es la Inteligencia artificial generativaQué es la Inteligencia artificial generativa
Qué es la Inteligencia artificial generativa
 
Programacion Anual Matemática5 MPG 2024 Ccesa007.pdf
Programacion Anual Matemática5    MPG 2024  Ccesa007.pdfProgramacion Anual Matemática5    MPG 2024  Ccesa007.pdf
Programacion Anual Matemática5 MPG 2024 Ccesa007.pdf
 
Ley 21.545 - Circular Nº 586.pdf circular
Ley 21.545 - Circular Nº 586.pdf circularLey 21.545 - Circular Nº 586.pdf circular
Ley 21.545 - Circular Nº 586.pdf circular
 

3eso estadística 02

  • 1. Bioestadística. U. Málaga. Tema 2: Estadísticos 1 Bioestadística Tema 2: Estadísticos
  • 2. Tema 2: Estadísticos 2Bioestadística. U. Málaga. Parámetros y estadísticos  Parámetro: Es una cantidad numérica calculada sobre una población  La altura media de los individuos de un país  La idea es resumir toda la información que hay en la población en unos pocos números (parámetros).  Estadístico: Ídem (cambiar población por muestra)  La altura media de los que estamos en este aula.  Somos una muestra (¿representativa?) de la población.  Si un estadístico se usa para aproximar un parámetro también se le suele llamar estimador. Normalmente nos interesa conocer un parámetro, pero por la dificultad que conlleva estudiar a *TODA* la población, calculamos un estimador sobre una muestra y “confiamos” en que sean próximos. Más adelante veremos como elegir muestras para que el error sea “confiablemente” pequeño.
  • 3. Tema 2: Estadísticos 3Bioestadística. U. Málaga.
  • 4. Tema 2: Estadísticos 4Bioestadística. U. Málaga. Un brevísimo resumen sobre estadísticos  Posición  Dividen un conjunto ordenado de datos en grupos con la misma cantidad de individuos.  Cuantiles, percentiles, cuartiles, deciles,...  Centralización  Indican valores con respecto a los que los datos parecen agruparse.  Media, mediana y moda  Dispersión  Indican la mayor o menor concentración de los datos con respecto a las medidas de centralización.  Desviación típica, coeficiente de variación, rango, varianza  Forma  Asimetría  Apuntamiento o curtosis
  • 5. Tema 2: Estadísticos 5Bioestadística. U. Málaga. Estadísticos de posición  Se define el cuantil de orden α como un valor de la variable por debajo del cual se encuentra una frecuencia acumulada α.  Casos particulares son los percentiles, cuartiles, deciles, quintiles,...
  • 6. Tema 2: Estadísticos 6Bioestadística. U. Málaga. Estadísticos de posición  Percentil de orden k = cuantil de orden k/100  La mediana es el percentil 50  El percentil de orden 15 deja por debajo al 15% de las observaciones. Por encima queda el 85%  Cuartiles: Dividen a la muestra en 4 grupos con frecuencias similares.  Primer cuartil = Percentil 25 = Cuantil 0,25  Segundo cuartil = Percentil 50 = Cuantil 0,5 = mediana  Tercer cuartil = Percentil 75 = cuantil 0,75
  • 7. Tema 2: Estadísticos 7Bioestadística. U. Málaga. Ejemplos  El 5% de los recién nacidos tiene un peso demasiado bajo. ¿Qué peso se considera “demasiado bajo”?  Percentil 5 o cuantil 0,05 Percentil 5 del peso Peso al nacer (Kg) de 100 niños frecuencia 1 2 3 4 5 0510152025
  • 8. Tema 2: Estadísticos 8Bioestadística. U. Málaga. Ejemplos ¿Qué peso es superado sólo por el 25% de los individuos?  Percentil 75 o tercer cuartil Percentil 75 del peso Peso (Kg) de 100 deportistas frecuencia 50 55 60 65 70 75 80 85 051015202530
  • 9. Tema 2: Estadísticos 9Bioestadística. U. Málaga. Ejemplos  El colesterol se distribuye simétricamente en la población. Supongamos que se consideran patológicos los valores extremos. El 90% de los individuos son normales ¿Entre qué valores se encuentran los individuos normales? Percentiles 5 y 95 Colesterol en 100 personas frecuencia 180 200 220 240 260 05101520
  • 10. Tema 2: Estadísticos 10Bioestadística. U. Málaga. Ejemplos  ¿Entre qué valores se encuentran la mitad de los individuos “más normales” de una población?  Entre el cuartil 1º y 3º Percentiles 25 y 75 Altura (cm) en 100 varones frecuencia 150 160 170 180 190 05101520
  • 11. Tema 2: Estadísticos 11Bioestadística. U. Málaga. Diagramas de Tukey  Resumen con 5 números:  Mínimo, cuartiles y máximo.  Suelen dar una buena idea de la distribución.  La zona central, ‘caja’, contiene al 50% central de las observaciones.  Su tamaño se llama ‘rango intercuartílico’ (R.I.)  Es costumbre que ‘los bigotes’, no lleguen hasta los extremos, sino hasta las observaciones que se separan de la caja en no más de 1,5 R.I.  Más allá de esa distancia se consideran anómalas, y así se marcan. Diagrama de cajas de Tukey: Resumen en 5 números Velocidad (Km/h) de 200 vehículos en ciudad densidad 40 45 50 55 60 65 0.000.020.040.060.08 40 45 50 55 60 65 Mín. P25 P50 P75 Máx. Diagrama de cajas de Tukey: Resumen en 5 números Velocidad (Km/h) de 200 vehículos en autovía densidad 80 90 100 110 120 130 140 0.000.010.020.030.04 80 90 100 110 120 130 140 Mín. P25 P50 P75 Máx.
  • 12. Tema 2: Estadísticos 12Bioestadística. U. Málaga. Ejemplo Número de años de escolarización 5 ,3 ,3 5 ,3 ,7 6 ,4 1,1 12 ,8 1,9 25 1,7 3,5 68 4,5 8,0 56 3,7 11,7 73 4,8 16,6 85 5,6 22,2 461 30,6 52,8 130 8,6 61,4 175 11,6 73,0 73 4,8 77,9 194 12,9 90,7 43 2,9 93,6 45 3,0 96,6 22 1,5 98,0 30 2,0 100,0 1508 100,0 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 Total Frecuencia Porcentaje Porcentaje acumulado Estadísticos Número de años de escolarización 1508 0 12,90 12,00 12 9,00 11,00 12,00 12,00 12,00 12,00 13,00 14,00 15,00 16,00 16,00 Válidos Perdidos N Media Mediana Moda 10 20 25 30 40 50 60 70 75 80 90 Percentiles ≥20%? ≥ 90%?
  • 13. Tema 2: Estadísticos 13Bioestadística. U. Málaga. Estadísticos de centralización Añaden unos cuantos casos particulares a las medidas de posición. En este caso son medidas que buscan posiciones (valores) con respecto a los cuales los datos muestran tendencia a agruparse.  Media (‘mean’) Es la media aritmética (promedio) de los valores de una variable. Suma de los valores dividido por el tamaño muestral.  Media de 2,2,3,7 es (2+2+3+7)/4=3,5  Conveniente cuando los datos se concentran simétricamente con respecto a ese valor. Muy sensible a valores extremos.  Centro de gravedad de los datos  Mediana (‘median’) Es un valor que divide a las observaciones en dos grupos con el mismo número de individuos (percentil 50). Si el número de datos es par, se elige la media de los dos datos centrales.  Mediana de 1,2,4,5,6,6,8 es 5  Mediana de 1,2,4,5,6,6,8,9 es (5+6)/2=5,5  Es conveniente cuando los datos son asimétricos. No es sensible a valores extremos.  Mediana de 1,2,4,5,6,6,800 es 5. ¡La media es 117,7!  Moda (‘mode’) Es el/los valor/es donde la distribución de frecuencia alcanza un máximo.
  • 14. Tema 2: Estadísticos 14Bioestadística. U. Málaga. Altura mediana
  • 15. Tema 2: Estadísticos 15Bioestadística. U. Málaga. Algunas fórmulas  Datos sin agrupar: x1, x2, ..., xn  Media  Datos organizados en tabla  si está en intervalos usar como xi las marcas de clase. Si no ignorar la columna de intervalos.  Media  Cuantil de orden α  i es el menor intervalo que tiene frecuencia acumulada superior a α ·n  α=0,5 es mediana n x x i i∑= Variable fr. fr. ac. L0 – L1 x1 n1 N1 L1 – L2 x2 n2 N2 ... Lk-1 – Lk xk nk Nk n n nx x i ii∑= )( 1 1 1 − − − − −⋅ += ii i i i LL n Nn LC α α
  • 16. Tema 2: Estadísticos 16Bioestadística. U. Málaga. Ejemplo con variable en intervalos Peso M. Clase frec Fr. acum. 40 – 50 45 5 5 50 – 60 55 10 15 60 – 70 65 21 36 70 - 80 75 11 47 80 - 90 85 5 52 90 - 100 95 3 55 100 – 130 115 3 58 En el histograma se identifica “unidad de área” con “individuo”. Para calcular la media es necesario elegir un punto representante del intervalo: La marca de clase. La media se desplaza hacia los valores extremos. No coincide con la mediana. Es un punto donde el histograma “estaría en equilibrio” si tuviese masa.
  • 17. Tema 2: Estadísticos 17Bioestadística. U. Málaga. Ejemplo (continuación) Peso M. Clase Fr. Fr. ac. 40 – 50 45 5 5 50 – 60 55 10 15 60 – 70 65 21 36 70 - 80 75 11 47 80 - 90 85 5 52 90 - 100 95 3 55 100 – 130 115 3 58 58  Moda = marca de clase de (60,70] = 65  Cada libro ofrece una fórmula diferente para la moda (difícil estar al día.) 3,69 58 31151055545 = ⋅++⋅+⋅ == ∑  n nx x i ii 6,66)6070( 21 15585,0 60 )( 585,0 1 1 15,0  =− −⋅ += − −⋅ +== − − − ii i i i LL n N LCMediana 8,76)7080( 11 365,43 70)( 5875,0 1 1 175,075 =− − +=− −⋅ +== − − − ii i i i LL n N LCP
  • 18. Tema 2: Estadísticos 18Bioestadística. U. Málaga. Variabilidad o dispersión  Los estudiantes de Bioestadística reciben diferentes calificaciones en la asignatura (variabilidad). ¿A qué puede deberse?  Diferencias individuales en el conocimiento de la materia.  ¿Podría haber otras razones (fuentes de variabilidad)?  Por ejemplo supongamos que todos los alumnos poseen el mismo nivel de conocimiento. ¿Las notas serían las mismas en todos? Seguramente No.  Dormir poco el día del examen, el croissant estaba envenenado...  Diferencias individuales en la habilidad para hacer un examen.  El examen no es una medida perfecta del conocimiento.  Variabilidad por error de medida.  En alguna pregunta difícil, se duda entre varias opciones, y al azar se elige la mala  Variabilidad por azar, aleatoriedad.
  • 19. Tema 2: Estadísticos 19Bioestadística. U. Málaga. Miden el grado de dispersión (variabilidad) de los datos, independientemente de su causa.  Amplitud o Rango (‘range’): Diferencia entre observaciónes extremas.  2,1,4,3,8,4. El rango es 8-1=7  Es muy sensible a los valores extremos.  Rango intercuartílico (‘interquartile range’):  Es la distancia entre primer y tercer cuartil.  Rango intercuartílico = P75 - P25  Parecida al rango, pero eliminando las observaciones más extremas inferiores y superiores.  No es tan sensible a valores extremos. 150 160 170 180 190 0.000.010.020.030.040.05 150 160 170 180 190 25% 25% 25% 25% Mín. P25 P50 P75 Máx. Rango intercuartílico Rango Medidas de dispersión
  • 20. Tema 2: Estadísticos 20Bioestadística. U. Málaga.  Varianza S2 (‘Variance’): Mide el promedio de las desviaciones (al cuadrado) de las observaciones con respecto a la media.  Es sensible a valores extremos (alejados de la media).  Sus unidades son el cuadrado de las de la variable. De interpretación difícil para un principiante.  La expresión es fea, pero de gran belleza ‘natural’ (físicamente). Contiene la información geométrica relevante en muchas situaciones donde la energía interna de un sistema depende de la posición de sus partículas.  Energía de rotación (vía el coeficiente de inercia): patinadores con brazos extendidos (dispersos) o recogidos (poco dispersos)  Energía elástica: Muelles ‘estirados’ con respecto a su posición de equilibrio (dispersos) frente a muelles en posición cercana a su posición de equilibrio (poco dispersos) ∑ −= i i xx n S 22 )( 1
  • 21. Tema 2: Estadísticos 21Bioestadística. U. Málaga. Desviación típica (‘standard deviation’) Es la raíz cuadrada de la varianza  Tiene las misma dimensionalidad (unidades) que la variable. Versión ‘estética’ de la varianza.  Cierta distribución que veremos más adelante (normal o gaussiana) quedará completamente determinada por la media y la desviación típica.  A una distancia de una desv. típica de la media hay más de la ‘más de la mitad’.  A una distancia de dos desv. típica de la media las tendremos casi todas. 2 SS = Peso recién nacidos en partos gemelares 3.300 2.900 2.500 2.100 1.700 1.300 900 500 50 40 30 20 10 0 Desv. típ. = 568,43 Media = 2023 N = 407,00
  • 22. Tema 2: Estadísticos 22Bioestadística. U. Málaga. Dispersión en distribuciones ‘normales’  Centrado en la media y a una desv. típica de distancia hay aproximadamente el 68% de las observaciones.  A dos desviaciones típicas tenemos el 95% (aprox.) 150 160 170 180 190 0.000.010.020.030.040.05 x±s 68.5 % 150 160 170 180 190 0.000.010.020.030.040.05 x± 2s 95 %
  • 23. Tema 2: Estadísticos 23Bioestadística. U. Málaga.  Datos ‘casi normales’. Eje ‘x’ medido en desviaciones típicas…  ¿Encuentras relación entre rango intercuartílico y desviación típica?  ¿Y entre los ‘bigotes’ y dos desviaciones típicas? ¿Podrías caracterizar las observaciones anómalas? -3 -2 -1 0 1 2 3 0.00.10.20.3 densidad -3 -2 -1 0 1 2 3 x ± s 66 % x ±2s 95 % -3 -2 -1 0 1 2 3 0.00.10.20.3 densidad -3 -2 -1 0 1 2 3 x ±s 71 % x ± 2s 94 % -3 -2 -1 0 1 2 3 0.00.10.20.30.4 densidad -3 -2 -1 0 1 2 3 x ± s 68 % x ±2s 94 % -3 -2 -1 0 1 2 3 0.00.10.20.3 densidad -3 -2 -1 0 1 2 3 x ±s 70 % x ± 2s 94 %
  • 24. Tema 2: Estadísticos 24Bioestadística. U. Málaga. Coeficiente de variación Es la razón entre la desviación típica y la media.  Mide la desviación típica en forma de “qué tamaño tiene con respecto a la media”  También se la denomina variabilidad relativa.  Es frecuente mostrarla en porcentajes  Si la media es 80 y la desviación típica 20 entonces CV=20/80=0,25=25% (variabilidad relativa)  Es una cantidad adimensional. Interesante para comparar la variabilidad de diferentes variables.  Si el peso tiene CV=30% y la altura tiene CV=10%, los individuos presentan más dispersión en peso que en altura.  No debe usarse cuando la variable presenta valores negativos o donde el valor 0 sea una cantidad fijada arbitrariamente  Por ejemplo 0ºC ≠ 0ºF  Los ingenieros electrónicos hablan de la razón ‘señal/ruido’ (su inverso). x S CV =
  • 25. Tema 2: Estadísticos 25Bioestadística. U. Málaga. Asimetría o Sesgo  Una distribución es simétrica si la mitad izquierda de su distribución es la imagen especular de su mitad derecha.  En las distribuciones simétricas media y mediana coinciden. Si sólo hay una moda también coincide  La asimetría es positiva o negativa en función de a qué lado se encuentra la cola de la distribución.  La media tiende a desplazarse hacia las valores extremos (colas).  Las discrepancias entre las medidas de centralización son indicación de asimetría.
  • 26. Tema 2: Estadísticos 26Bioestadística. U. Málaga.x 8 10 12 14 16 18 20 0.000.050.100.150.20 8 10 12 14 16 18 20 x ± s 78 % x -2 -1 0 1 2 3 0.00.10.20.30.40.5 -2 -1 0 1 2 3 x ± s 66 % x 0 2 4 6 8 10 12 14 0.000.050.100.150.20 0 2 4 6 8 10 12 14 x ± s 78 % Estadísticos para detectar asimetría  Hay diferentes estadísticos que sirven para detectar asimetría.  Basado en diferencia entre estadísticos de tendencia central.  Basado en la diferencia entre el 1º y 2º cuartiles y 2º y 3º.  Basados en desviaciones con signo al cubo con respecto a la media.  Los calculados con ordenador. Es pesado de hacer a mano.  En función del signo del estadístico diremos que la asimetría es positiva o negativa.  Distribución simétrica  asimetría nula.
  • 27. Tema 2: Estadísticos 27Bioestadística. U. Málaga. Apuntamiento o curtosis En el curso serán de especial interés las mesocúrticas y simétricas (parecidas a la normal). La curtosis nos indica el grado de apuntamiento (aplastamiento) de una distribución con respecto a la distribución normal o gaussiana. Es adimensional. Platicúrtica (aplanada): curtosis < 0 Mesocúrtica (como la normal): curtosis = 0 Leptocúrtica (apuntada): curtosis > 0 Aplanada 0.0 0.2 0.4 0.6 0.8 1.0 0.00.51.01.52.0 0.0 0.2 0.4 0.6 0.8 1.0 x±s 57 % Apuntada como la normal -3 -2 -1 0 1 2 3 0.00.10.20.3 -3 -2 -1 0 1 2 3 x± s 68 % Apuntada -2 -1 0 1 2 0.00.20.40.60.8 -2 -1 0 1 2 x± s 82 %
  • 28. Tema 2: Estadísticos 28Bioestadística. U. Málaga. 0 1 2 3 4 5 6 7 Ocho o más Número de hijos 5% 10% 15% 20% 25% Porcentaje n=419 28% n=255 17% n=375 25% n=215 14% n=127 8% n=54 4% n=24 2% n=23 2% n=17 1% Ejercicio: descriptiva con SPSS Descriptivos para Número de hijos 1,90 ,045 1,81 1,99 1,75 2,00 3,114 1,765 0 8 8 3,00 1,034 ,063 1,060 ,126 Media Límite inferior Límite superior Intervalo de confianza para la media al 95% Media recortada al 5% Mediana Varianza Desv. típ. Mínimo Máximo Rango Amplitud intercuartil Asimetría Curtosis Estadístico Error típ.  Está sombreado lo que sabemos interpretar hasta ahora. Verifica que comprendes todo. ¿Qué unidades tiene cada estadístico? ¿Variabilidad relativa?  Calcula los estadísticos que puedas basándote sólo en el gráfico de barras.
  • 29. Tema 2: Estadísticos 29Bioestadística. U. Málaga. ¿Qué hemos visto?  Parámetros  Estadísticos y estimadores  Clasificación  Posición (cuantiles, percentiles,...)  Diagramas de cajas  Medidas de centralización: Media, mediana y moda  Diferenciar sus propiedades.  Medidas de dispersión  con unidades: rango, rango intercuartílico, varianza, desv. típica  sin unidades: coeficiente de variación  ¿Qué usamos para comparar dispersión de dos poblaciones?  Asimetría  positiva  negativa  ¿Podemos observar asimetría sin mirar la gráfica?  ¿Cómo me gustan los datos?  Medidas de apuntamiento (curtosis)  ¿Cómo me gustan los datos?