1. Dr. Mayhuasca Salgado Ronald
Docente
Medidas de
dispersión
ESTADÍSTICA
2016-I
FACULTAD DE CIENCIAS DE LA SALUD – ESCUELA ACADÉMICO PROFESIONAL DE PSICOLOGÍA
2. Estadística Descriptiva
• Organización de datos
• Representación de datos: Tablas y Gráficos
• Medidas de resumen
• Medición de datos numéricos
1. Medidas de posición
2. Medidas de dispersión
3. Medidas de forma
• Medición de datos nominales
1. Proporción
2. Razón
3. Medición epidemiológica
3. Grado de variabilidad con que se separan o agrupan los valores de la distribución
MEDIDAS DE DISPERSIÓN
Rango: (recorrido, amplitud) es la diferencia entre los valores máximo y mínimo
Desviación media: promedia los valores absolutos de las desviaciones de la media.
Varianza 𝑺 𝟐: promedia los cuadrados de las desviaciones la media. Su unidad está
elevada al cuadrado.
Desviación típica o estándar S: raíz cuadrada de la varianza . Se expresa en las
mismas unidades que la media.
Coeficiente de variación de Pearson: Es la medida de dispersión de elección a la
hora de comparar medidas diferentes.
4. Son medidas que cuantifican la variabilidad de las observaciones con respecto a
un estadígrafo de tendencia central (generalmente la media aritmética).
Los principales estadígrafos de dispersión son:
• VARIANZA
• DISPERSIÓN ESTÁNDAR
• COEFICIENTE DE VARIACIÓN
MEDIDAS DE DISPERSIÓN
5. Describen cuán agrupados o dispersos se hallan los datos de la muestra en torno a los
valores centrales, siendo una expresión de la fluctuación del fenómeno estudiado.
MEDIDAS DE DISPERSIÓN
6. Varianza ( S2) y Desviación estándar (S o DE)
• Nos informan sobre la magnitud de la variación en los datos , la
magnitud con la cual las observaciones se agrupan en torno a las
medidas
• Sólo se aplica a variables cuantitativas (medidas en escala de
razón)
• Nos indica cuánto varía cada individuo respecto a la media
7. • Sólo calculables en variables cuantitativas.
• Son de las que más se usan y las que mejor expresan la variabilidad
del fenómeno estudiado.
• Si no se usa la media por NO ser un valor representativo
(distribuciones sesgadas), se recomienda no usar la varianza ni la
desviación estándar
Varianza ( S2) y Desviación estándar (S o DE)
8. Varianza ( S2)
• Se define como el promedio del cuadrado de las desviaciones con
respecto la media.
• Cuando la varianza es muestral, se denota como S2(x); y si la
varianza es poblacional entonces se denota como σ2.
• Estudiaremos la varianza muestral.
9. 1. Para datos no agrupados en tablas.
Obedece a la siguiente fórmula:
S2(X)=
n-1
Desarrollando esta sumatoria se puede llegar
a una forma más simple para calcular la
varianza: S2(X)=
n-1
Cálculo de la Varianza
10. 2. Para datos agrupados en tablas.
Obedece a la siguiente fórmula:
S2(X)=
n-1
De modo semejante al caso anterior,
desarrollando la fórmula se obtiene:
S2(X)=
n-1
• Xi: marca de clase
• fi: frecuencia absoluta
• m: número de clases o intervalos
Cálculo de la Varianza
11. Se define como la raíz cuadrada positiva de la varianza, y como la
varianza está expresada en unidades cuadradas, la desviación
estándar (que está en las mismas unidades de los datos) representa
mejor la variabilidad de las observaciones.
Desviación estándar (S o DE)
𝑆 𝑥 = 𝑆2(𝑥)
12. • La desviación típica muestral se representa por S. En Medicina clínica se
representa por DE (desviación estándar) y en las revistas inglesas pos SD
(standard deviation)
• Para poder interpretar, con la misma desviación típica, distancias por encima
como por debajo de la media, se requiere que la distribución sea simétrica.
Desviación estándar (S o DE)
13. • Si la distribución es asimétrica , la desviación típica no puede representar
simultáneamente los desvíos superiores e inferiores, entonces se recurre a
los cuartiles
• Para valorar la dispersión en escala ordinal es muy útil la diferencia entre el
1er y 3er cuartil, conocida como distancia intercuartil (RIQ)
Desviación estándar (S o DE)
14. “Un cálculo mental aproximado de la desviación típica, en una variable
con distribución simétrica, consiste en dividir entre 2 la distancia entre
el valor más alto (o el más bajo) y la media.”
Desviación estándar (S o DE)
El personal de salud de cierto hospital camina a una velocidad media de
3km/h, siendo los extremos de velocidad 2 y 4 km/h aproximadamente. ¿Qué
valor cree que puede tener la desviación típica?
Ejemplo:
Cobo E, Muñoz P, Gonzales JA. Estadística para no estadísticos. Bases para interpretar artículos científicos. Barcelona: Elsevier; 2007.
15. Ejemplo: Determine la S y la S2 de: 5 8 8 5 9
Varianza ( S2) y Desviación estándar (S o DE)
𝑆 𝑥 = 𝑆2(𝑥)
S2(X)=
n-1
Media: 7
: 3.5
: 1.87
Interpretación:
Existe una variación de 1,87
unidades de cada individuo respecto
a la media aritmética.
16. Sin importar la distribución de una variable numérica, al menos 75% de los datos
muestrales se hallan entre 𝑋 − 2𝑠 y 𝑋 + 2𝑠
Desviación estándar (S o DE) y promedio aritmético
17. Las relaciones más importantes se dan cuando la distribución de los datos es simétrica:
Desviación estándar (S o DE) y promedio aritmético
El intervalo más usado de los
anteriores es el que permite
alcanzar a 95% de los datos…
esto es u margen de
error de 95%
18. 1. Suponga que se ha medido la presión arterial sistólica a 5 pacientes:
115, 117, 124, 135 y 142 mmHg. Sin hacer el cálculo, diga qué valor
aproximado le parece correcto para la media:
1. 115 mmHg
2. 125 mmHg
3. 135 mmHg
MIR 15
19. 2. Suponga ahora que el resultado observado en los 5 pacientes ha sido
106, 117, 124, 135 y 142 mmHg, con una media de 130 mmHg. Sin hacer
el cálculo, diga que valor aproximado le parece correcto para la
desviación típica:
1. 5 mmHg
2. 20 mmHg
3. 35 mmHg
MIR 15
20. Coeficiente de variación (C.V.)
Es un valor adimensional, que se usa en la comparación de la variabilidad de
distribuciones que usen distintas unidades de medidas.
21. Coeficiente de variación (C.V.)
Se calcula del siguiente modo:
El C.V. se debe expresar en porcentaje, pues no tiene unidades y sirve como medida
de comparación con otras distribuciones de cualquier tipo de unidad…el C.V. mide
cuán dispersos se hallan los datos.
C.V. < 10% : representa una muestra que tiende a ser homogénea, los datos o
mediciones no son dispersos. Se puede usar la media y la D.E.
10%< C.V. < 20% : presentan una regular o moderada dispersión.
C.V. > 20% : los datos se muestran muy dispersos. Usaremos la mediana y el RIQ
𝑪. 𝑽. =
𝑺 (𝒙)
𝑿
22. EJEMPLO:
Rpta: La primera muestra es más homogénea y la dispersión
es mínima.
Coeficiente de variación (C.V.)
𝑪. 𝑽. =
𝑺 (𝒙)
𝑿
23. Coeficiente de variación (C.V.)
• Proporciona los elementos para comparar la variabilidad en distintos conjuntos de datos
que pueden tener distintas medias
• Indica el porcentaje de datos que están alejados de la media aritmética
• Una desviación estándar de 500 en una distribución con una media de 5000, sugiere una
variabilidad mayor que una desviación de 50 en una distribución de media 5000
• Generalmente se expresa en porcentaje
𝑪. 𝑽. =
𝑺 (𝒙)
𝑿
x 100%
24. Los siguientes datos corresponden a 20 lecturas de temperatura (en °F) tomadas en
varios puntos de una esterilizadora de calor seco.
415 460 510 475 430 410 425 490 500 470
450 425 485 470 450 455 460 480 475 465
Determine el coeficiente de variación e interprete.
Rpta: 6,07% .
Interpretación: El 6,07% de los datos se hallan alejados de la media. Los
datos son poco dispersos.
Resuelva
25. En una muestra de 360 personas el nivel medio de glucemia es 5mmol/L y
la desviación estándar es 0.5 ¿cuál es el coeficiente de variación?
1. 10%
2. 25%
3. 12,5%
4. 5%
5. 2,5%
MIR 93
26. Para comparar la variabilidad relativa de la tensión arterial diastólica de
una serie de individuos y la de su edad, tenemos:
1. Las desviaciones estándar
2. Los coeficientes de variación
3. Los rangos (recorrido)
4. Las varianzas
5. Las desviaciones medias
MIR 91
Observen como piden comparar la variabilidad de dos distribuciones de unidades
distintas (mmHg y años). Usaremos el C.V. por ser adimensional.
27. Se desea comparar dos métodos de determinación de las colesterolemias
que usan unidades de medidas diferentes ¿cuál de las siguientes
medidas de dispersión le permitiría comparar más correctamente su
variabilidad?.
1. Las desviaciones estándar
2. Los coeficientes de variación
3. Los rangos (recorrido)
4. Las varianzas
5. Las desviaciones medias
MIR 96
28. • Las principales medidas de dispersión son: varianza, desviación estándar y
coeficiente de variación de Pearson
• El C.V. es adimensional
• La desviación típica o estándar representa el alejamiento prototípico del centro
• Cuando la distribución es simétrica la DE recorre la misma distancia hacia la
izquierda que a la derecha
Conclusiones: