El documento describe diferentes medidas estadísticas para resumir y analizar datos, incluyendo medidas de tendencia central como la mediana y la media, medidas de dispersión como la varianza y desviación estándar, y medidas de asimetría. Explica cómo calcular estas medidas y cuándo aplicar cada una, resumiendo y simplificando grandes cantidades de datos para facilitar su interpretación.
2. • La enumeración de los datos representa un avance
importante en el análisis de la información
• La distribución de frecuencias organiza los datos en
un formato que facilita su análisis e interpretación
• La conversión a frecuencias relativas permite hacer
comparaciones valiosas y significativas.
Recordar que
3. • La utilización deLa utilización de distribuciones dedistribuciones de frecuencias enfrecuencias en
intervalos de clasesintervalos de clases, resume y condensa la, resume y condensa la
información presente en los datos; se pierde lainformación presente en los datos; se pierde la
información individual pero se gana en capacidadinformación individual pero se gana en capacidad
de análisis de características globales.de análisis de características globales.
• El uso de distintosEl uso de distintos gráficosgráficos permite una rápidapermite una rápida
visualización de estas características globales.visualización de estas características globales.
• Otra técnica estadística es poderOtra técnica estadística es poder resumir aspectosresumir aspectos
presentes en los datos con un único valor ( opresentes en los datos con un único valor ( o
algunos valores).algunos valores).
4. Descripción de los datosDescripción de los datos
• Medidas de Tendencia centralMedidas de Tendencia central
• Medidas de DispersiónMedidas de Dispersión
• Medidas de PosiciónMedidas de Posición
• Medidas de AsimetríaMedidas de Asimetría
5. Medidas de Tendencia centralMedidas de Tendencia central
• Intento de resumir la distribución, expresando el valor
que se puede considerar mas típico o representativo de
los datos.
• El término tendencia central implica la idea de un
“centro” identificable en la distribución. Tanto más útil
será ese valor en tanto más identificable sea ese
“centro”.
• Veremos:
- Modo o moda - Media Geométrica
- Mediana - Media aritmética
6. Modo o modaModo o moda
• Es el valor con mayor frecuencia en la distribución deEs el valor con mayor frecuencia en la distribución de
datos.datos.
• Si los datos están agrupados en clases corresponde alSi los datos están agrupados en clases corresponde al
punto medio de la clase con mayor frecuencia.punto medio de la clase con mayor frecuencia.
• Se aplica a datos medidos en todas las escalas vistas.Se aplica a datos medidos en todas las escalas vistas.
• Las distribuciones pueden ser unimodales, bimodales,Las distribuciones pueden ser unimodales, bimodales,
multimodalesmultimodales
7. Modo o modaModo o moda
• Ej: Variable cualitativa: sexoEj: Variable cualitativa: sexo
F F F F F F M M M M M M M M MF F F F F F M M M M M M M M M
Moda:Moda:
Ej: Variable cuantitativa discretaEj: Variable cuantitativa discreta
12 15 13 12 14 16 12 14 14 12 1412 15 13 12 14 16 12 14 14 12 14
Moda:Moda:
Masculino
12 y 14 (distribución bimodal)
1212 15 1315 13 1212 1414 1616 1212 14 1414 14 1212 1414
8. Modo o modaModo o moda
0
2
4
6
8
10
12
0 1 2 3 4
Número de consultas
Frecuenciaabsoluta
Moda: 1
0
0.05
0.1
0.15
0.2
0.25
0.3
0 1 2 3 4 5 6
Moda: 0 y 4
Figura 1 Figura 2
9. Modo o modaModo o moda
Gráfico sectorial para la distribución de los pacientes con anemia según
clasificacion morfológica de la misma.
50%
40%
10%
microcítica
normocítica
macrocítica
Moda: Microcítica
10. MedianaMediana
• Corresponde a la observación que se encuentra en elCorresponde a la observación que se encuentra en el
punto medio de la distribución ordenada de los datos.punto medio de la distribución ordenada de los datos.
• El 50% de los datos están por encima o debajo de esteEl 50% de los datos están por encima o debajo de este
valor. (Deja tantos datos con valores menores, comovalor. (Deja tantos datos con valores menores, como
con valores mayores).con valores mayores).
• A diferencia de la moda, es única para un conjuntoA diferencia de la moda, es única para un conjunto
dado de datosdado de datos
• Es aplicable cuando trabajamos con una variableEs aplicable cuando trabajamos con una variable
medida en escala por lo menos ordinal (ordinal, razónmedida en escala por lo menos ordinal (ordinal, razón
o intervalo)o intervalo)
12. Mediana-CálculoMediana-Cálculo
Se ordenan los n valores en forma creciente:Se ordenan los n valores en forma creciente:
xx11 < x< x22 < x< x33 < x< x44 < x< x55 < x< x66 < …..x< …..xnn
• Si n imparSi n impar
• Si n parSi n par
1
2
nMd X +=
1
2 2
2
n nX X
Md
+
+
=
13. Mediana: Datos agrupadosMediana: Datos agrupados
• Valor de la variable correspondiente al 0.50 en laValor de la variable correspondiente al 0.50 en la
frecuencia relativa acumuladafrecuencia relativa acumulada
0
10
20
30
40
50
60
70
80
90
100
15 20 25 30 35 40
Edad(años)
Frecuenciaacumulada%
15. Mediana: Datos agrupadosMediana: Datos agrupados
2.0
5
1.0
=
x
0
0.2
0.4
0.6
0.8
1
15 20 25 30 35 40
Edad(años)
Frecuenciaacumulada%
5x
0.20.1
2.0
1.05×
=⇒ x 5.2=⇒ x
16. Media AritméticaMedia Aritmética
• Ejemplo: Para la serie de datos utilizada anteriormente:Ejemplo: Para la serie de datos utilizada anteriormente:
1212 1515 1313 12 14 16 12 14 14 12 1412 14 16 12 14 14 12 14
µµ = (= (1212++1515++1313++1212++1414++1616++1212++1414++1414++1212++1414)/11=13.45)/11=13.45
o mejor:o mejor:
µµ = (= (1212××44++113+143+14××4+15+14+15+166)/11=13.45)/11=13.45
N
x
Ni
i
i∑
=
=
= 1
µ
17. Media AritméticaMedia Aritmética
• Es el promedio de las observaciones.Es el promedio de las observaciones.
• Se puede ver como un punto de equilibrio de la distribución,Se puede ver como un punto de equilibrio de la distribución,
o como un centro de gravedad de la mismao como un centro de gravedad de la misma
• Aplicada a datos cuantitativos (medidos en escala de razón oAplicada a datos cuantitativos (medidos en escala de razón o
de intervalo)de intervalo)
• Cálculo (población)Cálculo (población)
N
x
Ni
i
i∑
=
=
= 1
µ
18. Media Aritmética - CálculoMedia Aritmética - Cálculo
• Datos no agrupadosDatos no agrupados
• Datos agrupados
dónde mi=marca de clase y k es la cantidad de clases
n
x
X
ni
i
i∑
=
=
= 1
∑
∑ =
=
=
=
==
ki
i
ii
ki
i
ii
frm
n
fam
X
1
1
19. Media Aritmética - CálculoMedia Aritmética - Cálculo
∑
=
=
==
ki
i
ii frmX
1
49.10
466.11
30
3441
===
∑
=
=
n
fam
X
ki
i
ii
Intervalos Frec.
Absoluta
(fj)
Frec.
Relativa
(hj)
Marca de
clase (Xj)
Marca de
clase x
frec.
absoluta
Marca de
clase x frec.
relativa
7 - 8 3 0.10 7.5 22.5 2.25
9 – 10 7 0.23 9.5 66.5
11 – 12 9 0.30 11.5 100.5
13 – 14 8 0.27 13.5 108.0
15 -16 3 0.10 15.5 46.5
Total 30 100.0 344.0
20. Medidas de Variabilidad-Medidas de Variabilidad-
DispersiónDispersión
• Resume la magnitud con la cual los diferentes datosResume la magnitud con la cual los diferentes datos
difieren entre sí.difieren entre sí.
• Sirven como medida de homogeneidadSirven como medida de homogeneidad
• Nos dan elementos para evaluar la adecuación de laNos dan elementos para evaluar la adecuación de la
medida de tendencia central usada.medida de tendencia central usada.
• Veremos:Veremos:
RangoRango
VarianzaVarianza
Desviación estándarDesviación estándar
21. Rango o Amplitud totalRango o Amplitud total
• Rango= XRango= Xmaxmax-X-Xminmin
• Se utiliza para variables cuantitativas medidas enSe utiliza para variables cuantitativas medidas en
escala de intervalo o razónescala de intervalo o razón
• Inestable (muy afectada por los valores extremos)Inestable (muy afectada por los valores extremos)
• No aprovecha los datos, insuficienteNo aprovecha los datos, insuficiente
• Fácil de calcularFácil de calcular
22. Varianza y desviación estándarVarianza y desviación estándar
• Nos informan sobre la magnitud de la variación enNos informan sobre la magnitud de la variación en
los datos, la magnitud con la cual las observacioneslos datos, la magnitud con la cual las observaciones
se agrupan en torno a la mediase agrupan en torno a la media
• Sólo se aplica a variables cuantitativas (medidas enSólo se aplica a variables cuantitativas (medidas en
escala de razón o intervalo)escala de razón o intervalo)
• Para una población, la varianza es:Para una población, la varianza es:
2
2
1
( )i n
i
i
x
N
µ
σ
=
=
−
= ∑
23. Varianza y desviación estándar:Varianza y desviación estándar:
cálculocálculo
• PoblacionalPoblacional
• MuestralMuestral
• Muestral con datos agrupadosMuestral con datos agrupados
2
2
1
( )
1
i n
i
i
x x
s
n
=
=
−
=
−
∑
2
2
1
( )i n
i
i
x
N
µ
σ
=
=
−
= ∑
2
2
1
( )
1
i n
ai i
i
f m x
s
n
=
=
−
=
−
∑
24. Varianza y desviación estándarVarianza y desviación estándar
Desvíacion estándarDesvíacion estándar
PoblaciónPoblación
MuestraMuestra 2
s s=
2
σ σ=
25. Varianza y desviación estándarVarianza y desviación estándar
Ej: 5Ej: 5 88 8 5 98 5 9
Media=(5+Media=(5+8+8+5+9)/5=78+8+5+9)/5=7
2
2
1
( )
1
i n
i
i
x x
s
n
=
=
−
=
−
∑
87.15,3
5,3
4
41144
4
)79()78()78()75()75( 22222
2
==
=
++++
=
−+−+−+−+−
=
s
s
26. Coeficiente de variaciónCoeficiente de variación
Proporciona los elementos para comparar laProporciona los elementos para comparar la
variabilidad en distintos conjuntos de datos quevariabilidad en distintos conjuntos de datos que
pueden tener distintas medias.pueden tener distintas medias.
Una desviación estándar de 500 en una distribuciónUna desviación estándar de 500 en una distribución
con una media de 5000, sugiere una variabilidadcon una media de 5000, sugiere una variabilidad
mayor que una desviación de 500 en una distribuciónmayor que una desviación de 500 en una distribución
de media 50000de media 50000
28. Medidas de asimetríaMedidas de asimetría
• Se refiere a la simetría respecto a la media.Se refiere a la simetría respecto a la media.
Si f es la función de distribución, diremos que laSi f es la función de distribución, diremos que la
distribución es:distribución es:
Distribución simétrica
0
2
4
6
8
10
12
m-a
m
m+a
Densidad
Asimetría negativa
0
1
2
3
4
5
6
7
8
1 2 3 4 5 6 7 8 9
Densidad
0
1
2
3
4
5
6
7
8
1 2 3 4 5 6 7 8 9
Densidad
Asimetría positiva
( ) ( )f media a f media a− = +Simétrica si para todo a es
( ) ( )f media a f media a− < +Asimetría negativa si para algún a es
( ) ( )f media a f media a− > +Asimetría positiva si para algún a es
29. Medidas de PosiciónMedidas de Posición
• Cuantil: valor de la variable bajo el cual se encuentraCuantil: valor de la variable bajo el cual se encuentra
una cierta proporción de los valores de launa cierta proporción de los valores de la
distribución.distribución.
• Percentiles o centiles - C,100 partesPercentiles o centiles - C,100 partes
• Deciles - D, 10 partesDeciles - D, 10 partes
• Cuartiles - Q, 4 partes:Cuartiles - Q, 4 partes:
• Q1(25%), Q2(50%), Q3(75%)Q1(25%), Q2(50%), Q3(75%)
30. Mediana: Valor de la variable que deja por debajo al
50% de las observaciones
Percentil k: Valor de la variable que deja por debajo
el k% de las observaciones(Ej: P23, P45)
Decil k: Valor de la variable que deja por debajo el
(k*10)% de las observaciones (Ej: P10=D1, P20=D2,etc.)
Cuartil k:Valor de la variable que deja por debajo el
(k*25)% de las observaciones (Ej: P25=Q1, P75=D3,etc.)
Medidas de PosiciónMedidas de Posición
31. Medidas de Posición:Medidas de Posición:
equivalenciasequivalencias
• DD11=P=P1010
• QQ11=P=P2525
• QQ22=Md=P=Md=P5050
• Medidas derivadas:Medidas derivadas:
Rango intercuartílico: QRango intercuartílico: Q33-Q-Q11..
Desviacion intercuartil: (QDesviacion intercuartil: (Q33-Q-Q11)/2)/2
32. Ejemplo de AplicaciónEjemplo de Aplicación
Curvas de crecimientoCurvas de crecimiento
Peso-edadPeso-edad
Talla-edadTalla-edad
Perímetro cefálico-edadPerímetro cefálico-edad
Crecimiento intrauterino,etcCrecimiento intrauterino,etc
34. Algunas indicaciones respectoAlgunas indicaciones respecto
a medidas de resumena medidas de resumen
• No siempre es necesario indicar todas las medidas deNo siempre es necesario indicar todas las medidas de
resumen.resumen.
• Buscar las más significativas y representativas.Buscar las más significativas y representativas.
• En distribuciones sesgadas es mas apropiada laEn distribuciones sesgadas es mas apropiada la
mediana como medida de tendencia centralmediana como medida de tendencia central
• En distribuciones bimodales o multimodales , esaEn distribuciones bimodales o multimodales , esa
característica no debe dejar de mencionarse.característica no debe dejar de mencionarse.
37. Sesgo a izquierda. AsimetríaSesgo a izquierda. Asimetría
negativa. Media < Mdnegativa. Media < Md
38. Sesgo a derecha. Asimetría positivaSesgo a derecha. Asimetría positiva
Media>MdMedia>Md
39. Medidas para datos nominalesMedidas para datos nominales
Proporción:Proporción:
Numero (a) de observaciones con una característicaNumero (a) de observaciones con una característica
dada (como sano o enfermo) dividido entre el numerodada (como sano o enfermo) dividido entre el numero
total de observaciones de los sanos y enfermos (a+b) entotal de observaciones de los sanos y enfermos (a+b) en
un grupo dado. Esto es:un grupo dado. Esto es:
)( ba
a
proporcion
+
=
ResultadoResultado Trat ATrat A Trat BTrat B TotalTotal
SanoSano 9090 350350 440440
EnfermoEnfermo 810810 750750 15601560
TotalTotal 900900 11001100 20002000
45.0
2000
900
)1100900(
900
. ==
+
=ATrat
40. Razón:Razón:
Número (a) de observaciones en un grupo dado con unaNúmero (a) de observaciones en un grupo dado con una
característica dada (como sano) dividido entre el númerocaracterística dada (como sano) dividido entre el número
(b) de observaciones sin la característica dada (como estar(b) de observaciones sin la característica dada (como estar
enfermo). Esto es:enfermo). Esto es:
b
a
razon =
Tomando los datos de la tabla, la razón de sanos sobre
enfermos es:
282.0
1560
440
/ ==enfsanos